Каталог курсов
🌱
ВосприятиеПродвинутыйPRO

Все чувства вместе

Байтик попадает в Оркестровую яму с дирижёром Синтезией и осьминогом Октави! 12 миссий о мультимодальном ИИ: модальности, CLIP, text-to-image, image captioning, голосовые помощники, видео, GPT-4V, Gemini и кросс-модальное внимание.

12 уроков9–12 лет~6 часовИнтерактивные задания

О чём этот курс

Курс объясняет мультимодальный ИИ — системы, объединяющие текст, изображения и звук. Дети узнают о модальностях данных, CLIP, text-to-image, image captioning, голосовых помощниках, видеоанализе, GPT-4V, Gemini и кросс-модальном внимании. Финальный проект — мультимодальный ИИ-ассистент.

Чему научитесь

  • Понимание мультимодальности в ИИ
  • Знание о CLIP и связи текста с изображениями
  • Text-to-image и image-to-text
  • Анализ видео с помощью ИИ
  • Представление о GPT-4V и Gemini

Для кого

Продвинутый уровень, от 9 лет.Финальный курс программы, объединяющий все знания об ИИ.

Как проходит обучение

Интерактивные задания

Квизы, головоломки, симуляторы и творческие задачи в каждом уроке

Система XP и наград

За правильные ответы начисляются очки опыта и открываются достижения

12 уроков по 30 минут

Каждый урок — самостоятельная тема с теорией и практикой

Робот-проводник Байтик

Дружелюбный персонаж объясняет сложные темы простым языком

Программа курса

1

Один мозг — пять чувств

~30 мин

2

Три языка данных

~30 мин

3

Общее пространство смыслов

~30 мин

4

Из текста — в картинку

~30 мин

5

Из картинки — в текст

~30 мин

6

Из речи — в понимание

~30 мин

7

Видео = картинка + звук + время

~30 мин

8

GPT-4V и Gemini: ИИ видит и говорит

~30 мин

9

Кросс-модальное внимание

~30 мин

10

Когда чувства обманывают

~30 мин

11

Проект: Мультимодальный ассистент

~30 мин

12

Выпускной: Мастер всех чувств

~30 мин

Похожие курсы

Начать обучение

Регистрация бесплатная. Первый курс полностью бесплатно.

Мы используем cookies и сервисы аналитики для улучшения работы сайта. Подробнее