🤖 AI несеться: Мітап у Києві, Amazon інвестує в конкурента OpenAI, DALL-E прокачує Windows і Bing

AI HOUSE на зв’язку — повертаємося до вас із нашою добіркою найцікавішого, що відбувалося у світі штучного інтелекту за останні два тижні.

Традиційно починаємо лист з невеликого смолтоку, адже у нас є одразу кілька цікавих анонсів:

12 жовтня ми організовуємо мітап «Автономний АІ: можливості та ризики». Формат — дві короткі лекції та панельна дискусія. Зустріч пройде в Києві, а спікери точно вам сподобаються, адже це Олесь Петрів, CTO та співзасновник Reface, та Олександр Клименко, CTO в Zibra AI, — топові експерти з компаній, які входять в екосистему Roosh. Дізнатися більше та зареєструватися можна за посиланням.
У новому випуску AI HOUSE Podcast до нас завітав Дмитро Чаплинський, співзасновник lang-uk та «Канцелярської сотні». Поговорили про NLP, український корпус, збір і обробку даних, використання LLM для розбудови корпусів для малоресурсних мов, роботу над пейперами, програму з безоплатним TPU від Google, грант від KSE та багато іншого.

Сьогодні розібратися з головними новинами нам допоможе Роман Кислий, Research Data Scientist у Visa та за сумісництвом ведучий нашого подкасту. Тому подивитись останній випуск — просто must.

Що ж, до новин!

Amazon інвестує в Anthropic — компанію-розробника чат-бота Claude.

Корпорація купить міноритарну частку Anthropic за $1,25 млн, проте у неї залишається право збільшити свої інвестиції в Anthropic до $4 млрд. Ставки зроблені, адже це — найбільша інвестиція Amazon у стартап ever.

Водночас Anthropic хоче залучити ще більше грошей — компанія буквально вчора стало відомо, що компанія може отримати додаткові $2 млрд від Google та інших компаній. Цікаво, як компанія буде балансувати між двома конкурентами-гігантами.

Головна сила Клода — контекстне вікно на 100к токенів <в ChatGPT всього 8к>, яке дозволяє йому працювати з величезними документами та книгами. Зараз Anthropic планують тренувати Claude-NEXT, яка має бути в 10 разів сильнішою за наявні LLM, — ймовірно, велика частина грошей піде саме на цей напрям.

Думка Романа: Amazon поки стояв трохи в стороні від цієї “гонки LLM”, яка розгорілась між іншими великими компаніями, але краще пізно ніж ніколи. Потенційно компанія може стати конкурентом Microsoft, який активно вкладається в OpenAI.

Конкуренція — це завжди добре, тож скоро думаю можна очікувати інтеграції Claude з Sagemaker.

DALL-E підсилює Bing та Microsoft.

Через десять днів після анонсу DALL-E 3 став доступним через Bing. Кажуть, що нова версія в деяких аспектах працює краще за Midjourney і Stable Diffusion. Як потестити? Зайдіть сюди. Залогіньтесь/зареєструйтесь через обліковий запис Microsoft. І все — пишіть свій промпт і експериментуйте.

Тут ще й Microsoft пропонує забути про Photoshop і здмухнути пил з Paint, адже протягом кількох тижнів там з’явиться новий AI-генератор зображень на базі DALL-E <якщо у вас Windows 11>. Подробиць майже немає, але можна роздобути їх самостійно, приєднавшись до вейтліста, за яким ваш Paint оновиться раніше. Для цього увійдіть в свій аккаунт Microsoft і натисніть кнопку Cocreator на панелі інструментів.

Наш промпт: A grand dining table floating on clouds, set with lasagna mountains and garlic bread forests. The Flying Spaghetti Monster wearing a chef's hat is graciously serving plates to a variety of mythical creatures. A pasta nebula lights up the night sky as a floating banner reads 'Subscribe to AI HOUSE Newsletter. Як бачимо, з текстом у DALL-E поки не дуже :)

Думка Романа: Як на мене, основне покращення в DALL-E 3 — це значно краще розуміння контексту, і, як результат, значно релевантніша генерація.

З боку Microsoft — це додаткові плюси для використання їхніх продуктів і дуже продумана стратегія. У минулому AI HOUSE Podcast ми з Олексієм Сивоконем говорили про запуск копайлотів для багатьох продуктів MS, і таке просування DALL-E 3 дуже вписується в їхню стратегію.

Французький стартап Mistral випустив свою першу опенсорсну мовну модель Mistral 7B.

Компанія з’явилась у травні 2023-го, а вже через місяць залучила рекордні для Європи 105 млн євро взагалі не маючи жодного продукту — і от нарешті він з’явився.

Розробники заявляють, що Mistral 7B випереджає більшість сучасних великих мовних моделей на кшталт Llama 2, водночас використовуючи значно менші обчислювальні потужності. Модель можна використовувати безоплатно і «без обмежень», оскільки компанія не створювала жодного механізму модерації. Також її можна легко налаштувати на роботу з різними завданнями — від кодингу до аналізу текстів.

Думка Романа: Більшість команди Mistral або з DeepMind, або з Meta (один з них навіть є співавтором оригінальної статті LLaMA), тому Mistral можна вважати покращеною LLaMA-2.

Хоча, враховуючи що Mistral 7B по бенчмарках кращий ніж 13В версія LLaMA2, це точно не файнтюн, а повноцінна окрема модель. Загалом дуже класно, що такі моделі з’являються з Apache ліцензією, бо LLaMA має певні обмеження на комерційне використання.

Що ще нового у світі AI:

👁 ChatGPT навчився бачити, чути, говорити, а також виходити в Інтернет. Можливість відправляти йому картинки та голосові повідомлення мають з’явитися максимум до наступного понеділка у всіх користувачів Plus і Enterprise <войси — тільки зі смартфонів>. Щоб відправляти AI блукати за вас інтернетом, треба увімкнути відповідну функцію у налаштуваннях. Для цього натисніть три точки біля вашої пошти — Settings & Beta — Beta Features — включіть Browse with Bing. В OpenAI не уточнюють, коли ці функції стануть доступними для всіх.

🤖 Meta запустила чат-бот Meta AI. Він працює на основі великої мовної моделі Llama 2 і нового генератора зображень Emu. Зараз доступ до нового продукту має обмежена кількість американських користувачів Messenger, Instagram і WhatsApp, а також ті, хто куплять нові Ray-Ban Meta smart glasses <вже можна передзамовити> та VR-окуляри Quest 3.

🔮 Є чутки, що Сем Альтман разом із дизайнером iPhone Джоні Айвом працюють над першим пристроєм від OpenAI. Проєктом зацікавився CEO SoftBank Масайосі Сон, який може вкласти близько $1 млрд у новий продукт. Поки нема жодних подробиць щодо того, що це може бути за гаджет і чи дійсно його будуть створювати, проте журналісти називають його «iPhone у світі штучного інтелекту». Тримаємо руку на пульсі, адже така колаборація <і кількість грошей> звучать гучно.

🎧 Spotify планує додати нову функцію, яка дозволить подкастерам перекладати контент різними мовами, зберігаючи їхній голос, інтонацію та стиль розмови. Запартнерились з OpenAI, використовують інструмент Whisper, який може як транскрибувати англійську, так і перекладати її на інші мови. Зараз деякі подкасти вже доступні іспанською, скоро мають з’явитися французька та німецька. Сподіваємось, про українську не забудуть.

📝 148-денний страйк голлівудських сценаристів завершився. Результатом стали нові правила щодо ролі ШІ в письменницькій діяльності. Тепер AI заборонено самостійно створювати чи змінювати літературний матеріал. Водночас люди-письменники можуть використовувати AI-інструменти, дотримуючись певних правил. Поки невідомо, чи стане це прецедентом для інших профспілок — насамперед для Гільдії кіноакторів — Американської федерації артистів телебачення і радіо, через страйк яких зараз на паузі багато зйомок серіалів та кіно.

🦓 Zibra AI відзначає крутий майлстоун — вже понад 100 тис. кріейторів скористалися платформою української компанії, яка спрощує та пришвидшує процес створення візуальних ефектів для відеоігор і метавсесвітів за допомогою Gen AI.

📷 Adobe запустила вебверсію Photoshop з AI-інструментами на основі Firefly. Тепер розширювати картинку, додавати/видаляти об’єкти чи робити заливку можна буде за допомогою текстових промптів. Деяких функцій у вебверсії немає, а журналісти припускають, що вона зрештою використовуватиметься Adobe як платформа для тестування різних оновлень, найуспішніші з яких пізніше підуть в програму.

🖼 Getty Images запустила AI-генератор зображень, який навчали виключно на ліцензованих віжуалах. Тобто усі картинки, які користувачі згенерують там, будуть на 100% легальними. Ба більше, компанія обіцяє платити користувачам, якщо вона використовуватиме їхні зображення для подальших навчань своєї моделі.

🖇 Порція щастя для рекрутерів, адже LinkedIn додає AI-інструменти для навчання, підбору спеціалістів, маркетингу та продажів. Розібратись з ними ми не встигли (поки що вони доступні лише для олдових користувачів платформи), але звучить цікаво. Наприклад, компанія розказала про інструмент Recruiter 2024, якому можна буквально написати, якого кандидата ви шукаєте, а все інше за вас налаштує система.

😌 Ну і невеликий бонус: CEO JPMorgan Chase Джеймі Дімон вірить, що штучний інтелект може скоротити робочий тиждень до 3,5 днів, а також допоможе знайти ліки проти раку. Звучить надто оптимістично, тому тримайте трохи песимізму — ці зміни він прогнозує для наступного покоління, а не для нас.

Цікаве з мережі:

Андрей Карпати, який зараз працює в OpenAI, а раніше відповідав за AI в Tesla, написав цікавий твіт, у якому стверджує, що LLM-ки — це частина операційної системи нового покоління.

Що пише Карпати:

«Можливості великих мовних моделей, на яких працюють чат-боти зі штучним інтелектом, швидко розширюються. Зараз вони можуть:

вводити та виводити інформацію за різними модальностями (текст, звук, зір);

писати та запускати програми;

виходити в інтернет;

мають вбудовану базу даних для зберігання та пошуку файлів у внутрішній пам'яті.

Мені також подобається аналогія з найближчим сусідом — «операційною системою», оскільки індустрія починає формуватися аналогічним чином: Windows, OS X і Linux <-> GPT, PaLM, Claude і Llama/Mistral (?:))). Операційні системи встановлюються з застосунками за замовчуванням, проте також існують магазини застосунків. Більшість з них [програм] можна адаптувати під різні платформи.

TL;DR — дивитися на LLM як на чат-боти — це те саме, що дивитися на перші комп’ютери, як на калькулятори. Ми спостерігаємо зародження абсолютно нової обчислювальної парадигми».

Враховуючи те, як AI швидко вривається у тисячі аспектів нашого життя, а також новину про новий продукт від OpenAI — цей твіт сильно інтригує. Але це лише наші спекуляції :)

Ще одна цікава історія — як Meta та OpenAI кардинально по-різному дивляться на подальший розвиток AI.

Зараз у технологічній індустрії тривають важкі дискусії про переваги та ризики відкритого доступу до передових AI-моделей. Головним лобістом опенсорсу виступає Meta, яка робить свої AI-інструменти відкритими для всіх. У компанії впевнені, що такий підхід стимулює інновації, адже розробники постійно адаптують і розвивають ці моделі.

По-іншому думають в OpenAI та Anthropic. На їхню думку, випуск AI-моделей без регулювання може призвести до того, що ними активно користуватимуться зловмисники для дезінформації, кібератак або навіть розробки біологічної зброї. А тому кожен реліз високопродуктивної AI-моделі має проходити незалежну оцінку безпеку, зокрема зі сторони уряду США.

Microsoft та Google зайняли вичікувальну позицію.

Наприклад, MS публічно підтримує вимогу до компаній отримувати ліцензії перед випуском моделей; проте минулого місяця компанія випустила опенсосну LLM-ку Phi-1.5. Представники Google взагалі публічно не заявляли про свою позицію, а останню LLM з відкритим кодом компанія випустила у грудні 2022-го року.

Водночас доступ до найсучасніших моделей цих компаній можна отримати лише за гроші. Все це вказує на те, що індустрія далека від консенсусу щодо цього питання.

Це гостро відчувають стартапи та невеликі компанії, багато з яких покладаються на опенсорсні моделі. «Не має бути жодних регуляторних бар'єрів для відкритого коду», — пише засновник венчурного фонду a16z Марк Андрессен у своєму блозі. Закриття доступу до опенсорсних рішень змусить стартапи купувати ПЗ у великих технологічних компаній. Робити це готові далеко не всі. Річ не тільки в грошах, але й у розширенні і без того роздутого впливу великих корпорацій на світ.

Уряд і президент США не планують розв'язувати це питання швидко, що дає час керівникам технологічних компаній більше часу, щоб сформувати свої точки зору і, можливо, все ж таки знайти спільну позицію. Адже ставки дуже високі. Питання тягнеться далеко за межі сфери штучного інтелекту та технологічні можливості різних компаній — рішення ситуації в ту чи іншу сторону матиме значний вплив на глобальну економіку та навіть політику.

Дочитали до кінця? Тепер ви в темі всього, що несеться в AI. Не забудьте випити склянку води та залишити нам фідбек за цим посиланням. Готові слухати навіть найбожевільніші ідеї!

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через