Лучший учитель для искусственного интеллекта — это вы.

В следующем году Сбер начнет собирать «Народный датасет» для обучения моделей GigaChat и Kandinsky. С помощью такого подхода AI-сервисы станут еще лучше понимать российский культурный код.

Мы хотим, чтобы все смогли поучаствовать, приведя различные примеры. Чтобы все понимали, что мы имеем полную информацию о небольших регионах, о городской специфике, информацию о малых народах России, постарались добавить это все в наших моделях, чтобы именно наши модели в России были наиболее понимающие настоящую человеческую речь. Такой национальный штурм, национальный краудсорсинг информации для нашей модели, — руководитель блока «Технологическое развитие» Сбера Андрей Белевцев.

Он отметил, что при создании таких технологий важно учитывать российские традиционные ценности, особенности, историю и культуру, чтобы отечественные разработки в сфере искусственного интеллекта соответствовали национальным реалиям.

Лучший учитель для искусственного интеллекта — это вы.

В следующем году Сбер начнет собирать «Народный датасет» для обучения моделей GigaChat и Kandinsky. С помощью такого подхода AI-сервисы станут еще лучше понимать российский культурный код. Узнайте больше о проекте.

Мы хотим, чтобы все смогли поучаствовать, приведя различные примеры. Чтобы все понимали, что мы имеем полную информацию о небольших регионах, о городской специфике, информацию о малых народах России, постарались добавить это все в наших моделях, чтобы именно наши модели в России были наиболее понимающие настоящую человеческую речь. Такой национальный штурм, национальный краудсорсинг информации для нашей модели, — руководитель блока «Технологическое развитие» Сбера Андрей Белевцев.

Зачем нужен «Народный датасет»?

  • Улучшение понимания: Обучение ИИ на данных, отражающих российскую культуру, позволит ему лучше понимать запросы пользователей, реагировать на них и генерировать более релевантные ответы.
  • Локализация: Учет региональных особенностей, диалектов и культурных нюансов сделает ИИ-сервисы более адаптированными к российскому пользователю.
  • Развитие отечественных технологий: Создание датасета – вклад в развитие собственных ИИ-решений, независимых от зарубежных аналогов.

Он отметил, что при создании таких технологий важно учитывать российские традиционные ценности, особенности, историю и культуру, чтобы отечественные разработки в сфере искусственного интеллекта соответствовали национальным реалиям. Это включает в себя не только языковые особенности, но и понимание контекста, юмора, отсылок к культуре и истории, что делает взаимодействие с ИИ более естественным и комфортным для российских пользователей. Использование данных, собранных в рамках «Народного датасета», позволит улучшить работу таких сервисов, как распознавание речи, генерация текста, обработка изображений и многое другое. Discover More about how you can contribute!

От

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *