044525974 – сколько раз встречается цифра 5?OK: Move tools map after training data OK: Move glossary after GenAI process OK: Move §5 transition before glossary (after DL Q)
Восемь разделов. Сначала – что такое AI и какие у него направления. Потом – где он работает на практике, где ошибается, и как с ним обращаться без потерь.
Сначала разберёмся, что вообще скрывается за этим словом.
За одним термином – несколько вложенных слоёв. Generative AI, про который много говорят сегодня, – самый узкий и самый молодой из них.
Classical ML, Deep Learning и Generative AI – чем они отличаются друг от друга, и почему это важно понимать.
Антифрод – это Machine Learning. Биометрия – Deep Learning. ChatGPT – Generative AI. Все три встречаются ежедневно, все три называют 'AI'. При этом устроены по-разному. Возьмём пример банковского сектора.
Все три встречаются в банке. Но решают разные задачи, по-разному учатся и по-разному ошибаются. Самое важное – в одной таблице.
Узкие задачи, размеченные данные, измеримая точность.
Узкая задача. Размеченные данные. Бинарный ответ.
Это «детектор», который просмотрел миллионы прошлых транзакций и запомнил, какие из них странные. Каждую новую сравнивает с этим опытом.
Разбираем по шагам. Так работает любая классическая ML-модель: данные → модель → score → действие.
Узкие задачи, размеченные данные, измеримая точность. Возьмём пример банковского сектора – ML-системы давно встроены в работу банка.
«Уже работает» – мало. Важно, какой эффект это даёт. Типовые показатели по индустрии для четырёх ML-направлений из предыдущего слайда.
Зрелая технология не значит «бесконфликтная». Вот четыре места, где даже точная модель приводит к плохим бизнес-решениям.
Подкласс ML на нейросетях. Распознаёт лица, голос, текст в документах.
Тот же принцип «учиться на данных» – но с большим количеством слоёв. Каждый следующий слой строит более сложное обобщение из предыдущих.
Каждая делает свою узкую работу. Часто комбинируются друг с другом и с GenAI в одну систему.
Тысячи документов в день – раньше каждое поле вводилось руками. Сейчас OCR извлекает поля автоматически, человек только подтверждает спорные места.
Часто DL – это «незаметная» часть процесса. Клиент не видит, что в форму онбординга встроено OCR, а в колл-центре – ASR. Без них процесс был бы в разы медленнее. Возьмём пример банковского сектора.
«Уже работает» – мало. Важно, какой эффект это даёт. Типовые показатели по индустрии для трёх DL-внедрений из предыдущего слайда.
DL устойчивее на типовых случаях и более хрупок на нетиповых. Большинство сбоев – на стыке с физическим миром: плохое фото, шум, акцент.
Та самая технология, про которую сейчас все говорят. Самая молодая и самая нестабильная.
Универсальная задача. Публичные данные. Текст за текстом.
Это не словарь и не зачёт – просто чтобы дальше не приходилось останавливаться и пояснять термин на ходу.
Из этого свойства вытекают и сильные стороны, и ограничения.
Телефон предсказывает следующее слово на основе ваших прошлых сообщений.
ChatGPT работает по тому же принципу – но обучен не на личных сообщениях, а на большой части публичного интернета.
Чем ближе слова друг к другу, тем чаще они встречаются вместе и тем выше шанс, что модель выберет одно как продолжение другого. Покажем на смешном примере.
Каждое следующее слово – отдельное предсказание. Вот как это ощущается на руке: одно слово ставится, по нему предсказывается следующее, и так до конца ответа.
У большой модели в словаре – около ста тысяч токенов. И на КАЖДЫЙ следующий шаг генерации она перебирает их все.
Каждый ваш запрос проходит через эту цепочку. Каждое следующее слово в ответе – ещё один полный прогон по всей цепочке заново.
Цель слайда – ориентация в рынке. Не рекомендация к использованию.
GenAI в компаниях ещё в начале пути по сравнению с ML и DL, но эти четыре направления уже устойчиво приносят пользу. Возьмём пример банковского сектора.
Типовые показатели по индустрии для четырёх GenAI-направлений из предыдущего слайда. Цифры зависят от качества внедрения и зрелости процессов.
У GenAI свой набор рисков, отличный от ML и DL. Главный из них – уверенный тон при отсутствии гарантий. Дальше разберём на конкретных примерах.
044525974 – сколько раз встречается цифра 5?044525974 по позициям:
(1,8% + 2,3%) / 2 = 2,05%
Модель не проверяет, знает ли она ответ. Эта проверка – на стороне человека.
От теории к практике – реальные кейсы с измеримым эффектом.
Перед тем как открывать AI на новой задаче – три секунды на этот квадрат. Где она тут? Чем выше и левее – тем безопаснее.
Семь категорий задач, где модель действительно экономит время. Дальше – три коротких примера и один глубокий разбор реальной системы.
Уважаемый Сергей Александрович,
Уведомляем о задержке исполнения операции по вашему счёту на два рабочих дня. Задержка связана с дополнительными процедурами проверки, предусмотренными внутренним регламентом банка.
Средства зарезервированы и будут зачислены не позднее 14 ноября. Никаких действий с вашей стороны не требуется.
Если потребуется уточнение по статусу операции, свяжитесь со мной напрямую: Анна Петрова, персональный менеджер, +7 495 XXX-XX-XX.
С уважением,
Анна Петрова
Возьмём одно зрелое применение AI в банке и разберём на части – увидеть, что внутри одной «AI-системы» обычно сидит несколько разных моделей с разными сбоями.
Где не помогает, где опасен, и каких мифов стоит избегать.
Та же карта, что в начале раздела 3. На ней теперь подсвечен квадрат, где AI без дополнительных проверок опаснее всего: и проверить трудно, и цена ошибки высокая.
За мгновенным ответом ChatGPT – огромная инфраструктура, концентрированная у нескольких провайдеров. Это объясняет одновременно скорость, стоимость и регуляторные риски, о которых был предыдущий слайд.
AI готовит черновик. Подпись и решения остаются за человеком.
Аналогия – AI как младший ассистент: готовит черновик. Решения и подпись – за человеком.
Ответственность лежит на сотруднике и организации. Вендор и модель её не несут.
Регулятор не примет аргумент «это нам ChatGPT написал».
Не имеет значения, что черновик готовил AI. Подпись определяет авторство.
Пять рабочих правил для повседневной работы.
Из всего, что разобрали в первых пяти разделах, на практике сводится к пяти простым правилам. Каждый – на отдельном слайде ниже.
Где каждый из нас сейчас в работе с AI.
Главное за сегодня и что дальше.