эра для корпоративного искус-ственногоинтеллектаὈe;Ὀe;
IBM Granite — это мощное решение в области искусственного интеллекта, ориентированное на корпоративный сектор. Новый продукт по- зволяет компаниям использовать передовые возможности ИИ для анализа данных, автома- тизации и создания интеллектуальных систем, которые могут трансформировать бизнес-про- цессы. ἱ0;
Granite предлагает уникальное сочетание искусственного интеллекта и облачных техно- логий, помогая предприятиям решать самые сложные задачи — от прогнозирования спроса до автоматизации принятия решений. Особен- ность Granite — это гибкость и адаптивность в интеграции с различными платформами, что делает его идеальным решением для крупных организаций, стремящихся к цифровой транс- формации.
ὑ7; Узнайте больше об этом инновационном решении на официальной странице IBM: IBMGranite
Забудьте о бесконечных списках ссылок и рекламе! OpenAI запустил ChatGPT Search — но- вый умный поисковик, который сразу предоставляет вам точные ответы. Без лишнего мусо- ра, только полезная информация с картинками, источниками и даже удобными буллитами для простоты понимания. Это как иметь супер-ассистента, который всегда рядом и готов ответить на любой ваш вопрос. ᾞ0;✨
Платные подписчики могут уже попробовать новинку, а совсем скоро доступ откроется и для всех остальных. Просто нажмите на иконку «глобус» рядом с кнопкой прикрепления файлов, чтобы начать поиск.
ὑ7; Подробнее об этом нововведении читайте здесь: Introducing ChatGPT Search Introducing ChatGPT
Последние достижения в области искусственного интеллекта
Сегодня искусственный интеллект (AI) продолжает удивлять нас своими возможностями. Вот несколько свежих новостей из мира AI:
1. Google Duplex: Эта технология теперь может не только звонить от вашего имени, но и бронировать билеты или записывать вас к врачу! 2. OpenAI GPT-3: Этот языковый модель способен генерировать тексты практически любой сложности, включая статьи, стихи и даже код. 3. DeepMind AlphaFold 2: Эта система предсказывает структуру белков с высокой точностью, что открывает новые горизонты в медицине и биологии. 4. NVIDIA Omniverse: Платформа для создания виртуальных миров, которая позволяет дизайнерам и инженерам сотрудничать в реальном времени. 5. Tesla Autopilot: Продолжает совершенствоваться, добавляя новые функции безопасности и удобства вождения.
Эти разработки показывают, как быстро развивается AI и какие возможности он открывает перед нами. Следите за новостями, чтобы быть в курсе всех последних достижений!
Как покемоны обучают нейросети, а учёные научили AI «осязать» поверхности — читайте в нашем дайджесте
Dream Screen теперь может генерировать фоновые видео для YouTube Shorts, упрощая процесс создания контента. Пользователи смогут создавать их с помощью текстовых запросов благодаря интеграции модели Veo от Google DeepMind. Новая функция уже доступна в Канаде, Австралии и Новой Зеландии.
Samsung анонсировала новую AI-модель Gauss 2, которая умеет работать одновременно с текстом, изображениями и кодом. Модель будет доступна в трёх версиях: Compact, Balanced, Supreme. Gauss 2 позволит быстрее находить информацию в интернете, управлять звонками и редактировать контент с использованием генеративного AI.
Учёные разработали метод, позволяющий AI «чувствовать» и измерять поверхности без прямого контакта. Для этого они создали установку, которая использует лазер для сканирования поверхностей. Затем AI анализирует полученные изображения, чтобы определить текстуры и свойства материалов. Технология открывает новые перспективы для использования нейросетей в медицине, робототехнике и промышленности.
Apple работает над обновлением Siri, делая её более «разговорной» благодаря интеграции языковых моделей. Новая версия ассистента сможет лучше понимать контекст, поддерживать более естественные диалоги и решать сложные задачи, такие как создание расписаний или генерация текстов.
OpenAI добавила голосовой режим ChatGPT в веб-версию сервиса. Теперь пользователи могут не только вводить текстовые запросы, но и взаимодействовать с AI голосом. Функция поддерживает естественную речь, а ответы озвучиваются с помощью генерации речи.
Компания Niantic, разработчик игр Pokémon GO и Ingress, создаёт масштабную нейросетевую модель, которая обучается на данных о реальном мире, собранных игроками. Цель проекта — научить AI ориентироваться в пространстве, не только анализируя то, что он видит, но и используя общие представления об окружающем мире. Модель станет доступной для других разработчиков, что позволит применять её в создании AR-приложений и робототехнике.
— если обучали AI ещё до того, как это стало мейнстримом
Диалоговый робот с ChatGPT: можем ли мы контролировать его ответы?
«А вы можете подключить нам бота к ChatGPT?» Разбираемся, что на самом деле скрывается под этой формулировкой в запросе клиента, и рассказываем, как мы научились управлять ответами ChatGPT.
Около 90% заказчиков, которые приходят в «Наносемантику» за автоматизацией коммуникации, хотят «подключить бота к ChatGPT». Под этой формулировкой скрывается запрос на использование больших языковых моделей (LLM) для обработки пользовательского обращения и генерации ответа диалогового робота.
Совсем не обязательно, чтобы используемая модель была именно ChatGPT, который сам по себе является чат-ботом с генеративной нейросетью. Клиенты открыты к рассмотрению предложений от других поставщиков LLM и проявляют интерес к созданию кастомизированных решений на базе их данных, но «чтобы модель отвечала как ChatGPT».
«Подключите нам ChatGPT»
Как вендор интеллектуальной корпоративной платформы для разработки ботов мы видим, что бизнес еще не до конца сформировал ясное понимание о роли больших языковых моделей в ключевые коммуникационные процессы. ChatGPT накопил в себе много фактической информации, может рассказать шутку, сделать перевод, сгенерировать поздравление и даже написать научную работу. Это впечатляет, но как это поможет бизнесу в автоматизации процессов коммуникации? Как создать не просто собеседника на отвлеченные темы, а помощника для заказчика?
Что означает запрос «говорить как ChatGPT»? Под этой формулировкой обычно скрывается желание настроить базу знаний бота на определенную деловую сферу. Заказчики хотят, чтобы бот общался с клиентами по продуктам и услугам конкретной компании, собирал и записывал обращения потребителей, вел работу с документами согласно регламентам компании, выполнял рутинные повторяющиеся действия, например, оформлял заявки или подключал новые услуг, транзакции, т.д. Но при этом заказчики ожидают, что бот будет общаться с клиентами на естественном языке как живой человек, а не отвечать набором заранее записанных фраз. То есть бот должен понимать разные варианты выражения одного и того же смысла, помнить историю диалога, реагировать на эмоциональный тон собеседника, узнавать клиента и помнить, в каком стиле предпочтительно вести с ним диалог. Такой бот должен также различать интонации речи, голоса взрослых и детей и учитывать эту информацию при стилизации своих ответов. У бота должна быть «коммуникационная личность» ‒ способность обучаться генерировать ответы в заданном стиле, соответствующем его визуальному образу и «истории».
Но есть и подводные камни
Крупные языковые модели открывают большие возможности для адаптивности и интерактива, но они же создают и потенциальные проблемы: например, так называемые «галлюцинации» (генерация некорректной или вымышленной информации) и сложности в управляемости ответов.
LLM по сути является «черным ящиком»: никто кроме самих разработчиков не может проанализировать реальные корпусы данных, использованные для обучения этих моделей. «Протоколы» обучения также закрыты для широкой аудитории. Все это создает гипотетические риски: в обучающий датасет преднамеренно могут быть внесены данные, которые при определенных условиях нарушат работу модели в важных бизнес-процессах. Такие ошибки могут быть восприняты как «галлюцинации» языковой модели, что представляет угрозу в критически важных сценариях.
Еще один важный аспект ‒ точность и надежность ответов, которые имеют критическое значение в корпоративной бизнес-среде. Неправильные или не соответствующие стандартам ответы могут повлиять на восприятие бренда и доверие клиентов. Поэтому с одной стороны, большие языковые модели имеют огромный потенциал для улучшения взаимодействия с клиентами, с другой ‒ использоваться их нужно с осторожностью и под контролем.
Что делать
Чтобы преодолеть подобные вызовы, на наш взгляд, нужна интеграция генеративного ИИ (GenAI) с существующими системами и базами данных компаний. Улучшить опыт также поможет разработка гибридных подходов, которые сочетают в себе сценарные и генеративные методы. В нашей практике мы используем два алгоритма работы с ChatGPT при разработке виртуального ассистента.
Во-первых, для управления ответами модели мы можем писать промпты, или инструкции: изначально давать ей указания «Говори так и этак, на такие вопросы отвечай, а на такие ‒ нет». Промпт передается функцией в начале диалога или с каждым запросом, это зависит от логики и целей диалога. С помощью нашей диалоговой платформы мы можем настроить своеобразный пайплайн: сначала ее средствами проверить, удалось ли классифицировать и понять запрос, и есть ли в базе знаний готовый ответ. Если есть, то выдается он, если нет, то тогда идет обращение к ChatGPT. Но риск, что ответы иногда все же будут нечеткими, остается, так как ChatGPT ‒ cложная генеративная нейросеть и действует по своим алгоритмам. Мы также можем дополнять ответ от GenAI припиской в самом ответе и предупреждать собеседника, что ответ сгенерирован нейросетью.
Во-вторых, мы можем обучать диалогового робота по предоставленным компанией материалам. При этом для LLM важно, чтобы загруженный материал был однородным, а не разномастным, и его не рекомендуется сильно перегружать данными. Иначе модель может выдать достаточно непредсказуемый результат. Часто требуется дополнительная работа с исходными данными и помощь специалистов по data science.
Оба подхода были использованы, например, при создании популярного цифрового политического алгоритма ИИ, и остаются актуальными в наших разработках сложных цифровых аватаров и роботизированных систем.
Схема работы голосового ассистента для управления робототехнической системой. «Мозговым центром» является диалоговая платформа.
Какую именно LLM использовать в боте
Те разработчики, которые уже опробовали популярный ChatGPT, упоминают также и затруднения, с которыми сталкиваются при внедрении. Проанализировав их опыт, можно выделить сложности с доступом к ChatGPT из России, проблемы при работе с длинными промптами, порой долгое ожидание ответа, и особенно «корявый» русский язык в ответах ‒ неточность формулировок, неестественные обороты речи, ошибки и нарушения привычной структуры предложений. В этом случае перспективным выглядит будущее LLM российских вендоров: Яндекс и Сбер активно разрабатывают свои большие модели.
Но и здесь есть подводные камни. Данные решения облачные, а значит, потенциально могут появиться проблемы при работе с персональными данными: гарантии их конфиденциальности отсутствуют. То же самое относится к любой важной бизнес-информации.
Оптимальным решением для заказчика мы считаем обучение индивидуальной LLM. Такая модель может быть размещена внутри корпоративного контура, что решает вопросы, связанные с конфиденциальностью данных. Она будет работать с предоставленными данными, однако не сможет, например, написать научную работу с обзором мировых трендов, если подобные примеры не были изначально включены в набор данных для ее обучения.
В новой соцсети пользователи создают ветки обсуждений, спорят и троллят друг друга, вот только все они — нейросети
Разработчик показал клон Reddit, заполненный чат-ботами для имитации живой дискуссии со сленгом и знанием интернет-культуры.
На Deaddit (так называется платформа) можно почитать как исторические треды о династии Тюдоров в Англии, так и рассуждения о социализации в видеоиграх. Всем тут заправляют «искусственные интеллекты», человеку можно только смотреть.
Среди LLM есть:
Llama
Mixtral
GPT-4o mini
Claude Можно даже отсортировать ленту под конкретные модели. Сайт пока релизнут в демо-версии с открытым кодом, в будущем на площадку планируется добавить генерацию изображений.
Новые возможности для управления персонализацией в Google Play
В ближайшие несколько недель в Google Play появятся новые возможности для персонализации. Настраивать предпочтения и управлять данными станет ещё проще.
Благодаря персонализации вы можете находить подходящие именно вам игры, полезные приложения, специальные предложения и многое другое. Подробнее о персонализации в Google Play…
Новые функции будут доступны вместе с другими настройками предпочтений в разделе Персонализация в Google Play в меню сервиса. На этой странице вы сможете:
•Изменять все настройки персонализации в Google Play и просматривать историю действий.•Выбирать приложения, книги и другой контент из библиотеки, которые будут использоваться для персонализации Google Play. Вы сможете одним нажатием исключать данные, на основе которых материалы не должны подбираться. Например, это может быть информация об установке или удалении приложения и сведения о покупках или действиях в нем. Подробнее о новых настройках персонализации…
С расширенными возможностями персонализации пользоваться Google Play станет ещё удобнее. При этом ваши настройки конфиденциальности не изменятся.
На рынок вышли две умные колонки SberBoom Home и SberBoom Mini 2 с искусственным интеллектом GigaChat
Вместе с GigaChat новые колонки могут решать множество творческих задач: придумывать рецепты, шутки, поздравления, составлять инструкции, распорядок дня или план тренировок. А дети с их помощью могут сочинять сказки и придумывать игры. Достаточно сказать: «Салют, включи GigaChat».
Какие ещё обновления в умных колонках?
SberBoom Home: монохромный LED-дисплей с погодой, временем или пробками анимация эмоций колонки высокая износостойкость внешнего пластикового покрытия встроенный Zigbee-модуль для управления умным домом даже без подключения к интернету мощность звука 8 Вт
SberBoom Mini 2: новый полупрозрачный корпус обновлённая цветовая палитра мощность звука 5 Вт
В обеих колонках: технология Magnetic Sound: более насыщенное и чистое звучание с глубокими басами режим совместной работы с ТВ: поиск фильмов, переключение каналов, управление видеоплеером вывод звука телевизоров на умные колонки
SberBoom Home и SberBoom Mini 2 уже доступны к покупке в интернет-магазине SberDevices
Made by Google: селфи-помощник, пульсометр и смартфон-поводырь
13 августа Google провела ежегодную презентацию новых девайсов с внедрением AI. Разбираем самое интересное.
Смартфоны: Google Pixel 9 Google Pixel 9 Pro Google Pixel 9 Pro XL Гаджеты отличаются размером экрана, камерами и объёмом памяти, а дизайном стали больше напоминать iPhone. Дополнительно представили складной смартфон Pixel 9 Pro Fold.
Смарт-устройства: Pixel Watch 3 — умные часы в двух размерах для любых запястий, водонепроницаемые, держат заряд до 24 часов, а также вызовут скорую, если обнаружат потерю пульса Pixel Buds Pro 2 — наушники с поддержкой нейросети Gemini через смартфон. Голосовой помощник будет отвечать на вопросы, управлять календарём и выстраивать маршрут в картах
Искусственный интеллект: Gemini Live — расширенный голосовой помощник Magnifier — фича для слабовидящих: анализирует окружение, например, считывает указатели при наведении камеры на них сразу несколько апдейтов для камеры: добавляет не попавшего в кадр человека, улучшает панорамы, генерирует объекты и подсказывает, как лучше всего сделать селфи