🤖 AI несеться: Meta та Google кидають виклик GPT-4, Bard синхронізується з Gmail, Docs і Youtube та GenAI Lab від SoftServe

На зв’язку AI HOUSE, і це наш другий дайджест «AI несеться» з головними новинами та найцікавішими історіями зі світу штучного інтелекту.

Але спочатку кілька швидких апдейтів.

Ви просили — ми зробили: тепер ви можете менеджити поштові розсилки AI HOUSE. Обирайте, який саме контент ви хочете отримувати, а який ні.
Новий AI HOUSE Podcast вже чекає, щоб ви його послухали. Восьмий випуск присвятили темі NLP та майбутньому цієї технології, обговорили, як буде виглядати робота NLP-спеціалістів через декілька років. Також дізналися більше про те, як працює Microsoft Copilot й отримали кілька лайфхаків з промптингу від Олексія Сивоконя, Principal Applied Scientist у Microsoft.

Сьогодні розібратись з головними подіями у світі AI нам допоможе Богдан Питайчук, Chief AI Officer та кофаундер Gathers — компанії, яка допомагає імплементувати штучний інтелект у діяльність бізнесу. Gathers є частиною технологічної екосистеми Roosh.

1. Журнал Time опублікував список Time 100/AI, у якому видання зібрало 100 лідерів та інноваторів, які розвивають сферу штучного інтелекту.

У якому ще списку ви могли б побачити разом засновника OpenAI Сема Альтмана, CEO DeepMind Деміса Гассабіса та співачку Граймз? Насправді матеріал відзначає багатьох менш відомих широкому загалу людей, які прямо зараз роблять найвагоміший внесок у розвиток технології майбутнього. До речі, для тих, хто не згоден зі списком — журналісти Time також пояснили, як саме вони його формували.

2. Google та Meta працюють над новими AI-моделями, щоб кинути виклик GPT-4. OpenAI готує відповідь.

Google анонсував свою мультимодальну модель Gemini ще весною. Потенційно звучить круто — модель працюватиме з текстом, кодом і навіть зображеннями. Нещодавно компанія надала доступ до Gemini невеликій групі компаній, а офіційний реліз планується вже найближчим часом. У Google сподіваються, що їхня нова модель зможе конкурувати з GPT-4 — профільні журналісти вже називають Gemini «найважливішою AI-ставкою» компанії.

Meta також працює над новою моделлю, проте у неї поки немає публічного імені. Ба більше, власне тренування моделі розпочнуться вже у 2024 році. Зараз компанія скуповує чіпи та розбудовує data-центри, щоб зменшити залежність від хмарної платформи Microsoft Azure. Подробиць про саму модель поки небагато — тільки те, що вона має бути кращою за нещодавно випущену Llama-2, а орієнтиром виступає якраз GPT-4.

Водночас OpenAI також не спить — компанія зараз працює над власною мультимодальною моделлю Gobi, щоб залишитись на крок попереду конкурентів. Подробиць про її навчання дуже мало. Існують припущення, що OpenAI може таємно тренувати GPT-5, хоча поки це залишається чутками.

Думка Богдана: Конкуренція — це класно. Серед цих трьох компаній особисто я найбільше вірю в Meta, тому що це компанія, яка найактивніше підтримує open source ком’юніті станом на зараз. Взяти їхні моделі LLaMA — вони є дуже сильними рушіями оупен сорсу, за що Фейсбуку респект, і ми дуже схрещуємо пальчики, що все буде так продовжуватися і надалі.

OpenAI сто відсотків тренує нові версії моделей. Побачимо, чи буде доступ до мультимодальності. Ну і цікаво, якого саме типу буде ця мультимодальність. Одна справа — фотографії котиків-собачок, інша — зрозуміти зображення графіка та всіх відношень, які є на ньому. Тому цікаво, наскільки потужною буде ця фіча.

Google також підтримую, але історія релізів їх моделей не вражає. Враховуючи, що у них був аналог ChatGPT ще дуже давно, який вони не показували публічно, зараз все, з чим виходить компанія, не витримує конкуренцію. Той-таки Bard дуже слабкий. Щодо Gemini — побачимо.

3. Bard можна синхронізувати з Gmail, YouTube, Docs та іншими інструментами Google.

Чат-бот тепер може допомагати вам працювати з усіма інструментами Google, якими ви користуєтесь. Тепер можна попросити AI зібрати найважливіше з листування за останні два тижні з певним контактом у пошті, прокласти маршрут до кафе, про яке вам написали, а потім глянути на Youtube відео з останнього концерту, який там проходив, — і все це в межах однієї бесіди.

Оновлення також отримала функція Google It, яка дозволяє перевіряти відповіді Барда. Покращення стали можливими завдяки оновленню моделі PaLM 2, зазначають в компанії.

Думка Богдана: Інтеграція Bard в продукти екосистеми — це дуже сильний крок від Google. Водночас нові можливості їхнього чат-бота знову слабші за той наратив, який дає компанія.

Ми вже протестили Барда — попросили його проаналізувати список останніх мейлів від певного адресата. Як виявилось, необхідно додавати три-п’ять уточнень, щоб отримати бажаний результат. Ініціатива класна, але на практиці це скоріше PoC ніж готовий продукт.

Зараз люди очікують від AI класного результату, що він одразу зрозуміє, чого вони хочуть. У Барда з цим дуже слабко, на жаль. Проте сильна сторона Google — це, звичайно, інтеграція. Наприклад, я б не хотів передавати свої мейли ще й OpenAI; водночас Google їх вже має, тому тут вже не гріх іноді користуватися Бардом.

Що ще нового у світі AI:

🤖 Antropic представив преміум версію чат-бота Claude. За $20/місяць ви отримаєте пріоритетний доступ у періоди високого трафіку і ранній доступ до нових функцій.

🔥 OpenAI анонсувала DALL-E 3. Обіцяють, що це “стрибок вперед” у здатності генерувати зображення. З жовтня нова версія DALL-E буде доступна для користувачів ChatGPT Plus і ChatGPT Enterprise, а трохи пізніше восени відкриється доступ через API та в OpenAI Labs. Коли ж вийде безплатна публічна версія, компанія не повідомила. Крутою фішкою є інтеграція DALL-E та ChatGPT — тепер користувачі можуть просити чат-бот писати чи переробити їхні промпти для генератора зображень.

📝 OpenAI підтвердила, що інструменти, які мають виявляти згенерований AI-моделями текст, не працюють. Їхній власний тул AI Classifier показав точність 26%; ChatGPT також не вміє відрізняти тексти, створені людиною та машиною. У компанії стверджують, що у майбутньому ситуація навряд зміниться.

🎵 Тепер стати діджеєм <якщо у вас була така ціль> ще легше, адже Stability AI запускає Stable Audio — генератор музики та звуків. Безоплатно можна згенерувати трек до 45 секунд, підписка Pro дасть можливість робити 90-секундні треки.

✍🏼 Немає часу прослухати всі збережені подкасти? Застосунок Matter отримав нову функцію, яка транскрибуватиме подкасти. Користувачі зможуть взаємодіяти з текстом — виділяти цікаве, робити нотатки та ділитися цитатами. Водночас сам текст і аудіо будуть синхронізованими — користувачі матимуть змогу перемикатися між читанням та прослуховуванням.

💰 Податкова служба США використовуватиме ШІ для боротьби з ухиленням від сплати податків. Вже планується перевірка 75 компаній з бюджетами понад $10 млрд.

👊 Стартап Helsing залучив рекордні для європейського AI-ринку $233 млн під час Round B. Тепер Helsing — потенційно найбільший європейський стартап-єдиноріг у галузі оборонних технологій. Компанія активно працює з урядами країн Європи, зокрема з Україною, розробляючи технології для радіоелектронної боротьби для літаків на основі ШІ.

🖼 Популярні AI-інструменти для створення зображень погано генерують текст всередині картинок. Цю проблему вирішує стартап Ideogram — їхній інструмент генерує гірші картинки у порівнянні з конкурентами на кшталт DALL-E та Midjourney, зате він закриває одну з головних слабкостей цих моделей. Тепер згенерувати текст на зображенні буде набагато легше.

🥼 SoftServe створює GenAI Lab, де команда працюватиме за трьома ключовими напрямами: AI Discovery (дослідження та валідація застосування генеративного AI); AI Launchpad (експерименти та тестування AI-інструментів на конкретних бізнес-кейсах; AI Adoption (швидке масштабування та продукціоналізація AI). Для проєкту шукають 15 спеціалістів з Data Science.

📷 Adope платитиме авторам стокових зображень на Adobe Stock, які компанія використовувала для тренування своєї Gen AI-моделі Firefly. Користувачі, які розміщували свої роботи у стандартних та преміум колекціях, отримуватимуть грошову виплату. Сума буде розраховуватись за кількістю контенту, який Adobe використала під час навчання Firefly, однак загальний банк наразі невідомий.

🥤 Coca-Cola випустила лімітовану серію напою Y3000, що має смак майбутнього. Автор дизайну та, власне, смаку — штучний інтелект. Щоправда, купити унікальну колу можна тільки в США та Канаді.

Замість вибору найкращого AI-tool — ультимативна добірка від a16z.

Навіщо розказувати про один класний інструмент, якщо команда одного з найбільших венчурних фондів світу провела величезну роботу та представила 50 найпопулярніших AI-інструментів? Впевнені, що там точно буде щось цікаве для вас. А ми поки коротко висновки з дослідження:

На ChatGPT припадає понад 60% загального місячного трафіку серед топ-50. Станом на червень 2023 року він має 1,6 млрд відвідувань і 200 млн унікальних користувачів щомісяця.
Більшість найпопулярніших інструментів на базі генеративного AI є відносно новими. 80% сайтів були створені протягом останнього року. Це означає, що сфера тільки розвивається, а великі корпорації або не знають, або тільки планують свої кроки.
Інструменти зі списку використовують різні підходи для створення продуктів: хтось робить власні моделі, хтось допрацьовує вже наявні, а хтось робить обгортку, щоб спростити використання AI-інструментів. Найбільше капіталу залучають перші.
Дуже популярними є різні інструменти для генерації контенту — особливо зображень.
Ринок дуже фрагментований: у більшості напрямів і досі немає «переможців» — домінуючих гравців на кшталт ChatGPT, на яких усі рівняються. Ринки відкриті до нових інструментів, компаній та рішень.
Більшість інструментів зі списку виросли органічно, тобто майже не використовували платне просування. Споживачі готові платити за круті продукти — 90% компаній монетизуються за допомогою моделей підписки. Середня ціна — $21/місяць.
Мобільні платформи набирають оберти. Попри те, що більшість AI-інструментів розробляються під браузер, деякі компанії (PhotoRoom, CharacterAI та Speechify) мають більше трафіку з мобільних застосунків, ніж з комп’ютерів.
Ринок AI-інструментів все ще дуже молодий і динамічний. А тому нові гравці неодмінно матимуть свій шанс, якщо створять якісний та унікальний продукт.

Цікаве з мережі

Що потрібно для створення власних AI-інструментів? Сервери, дата-центри, тисячі комп’ютерів і відеокарт, мільйони мікрочипів, неймовірна кількість людських ресурсів… А ще вода. Дуже. Багато. Води.

Річ у тім, що розробка та навчання інструментів на кшталт ChatGPT — це величезні обчислювальні потужності. Які генерують тепло. Багато тепла. А для охолодження дата-центрів часто використовують саме воду.

З 2021 по 2022 рік компанія Microsoft збільшила глобальне споживання води на 34% — до майже 6,5 млрд літрів. В першу чергу це відбулося через партнерство з OpenAI. У Google також розповіли, що за цей час компанія збільшила використання води на 20%, зокрема через роботу над моделями штучного інтелекту. Важко навіть подумати, яка ситуація зараз, коли сотні мільйонів людей користуються чат-ботами та іншими AI-інструментами.

Зараз компанії активно інвестують у різноманітні дослідження, щоб виміряти енергетичний і вуглецевий слід AI. Наприклад, в одній зі статей, яка буде опублікована пізніше цього року, команда вчених підрахувала, що кожні ваші 5-50 промптів використовують 500 мл води. Не дивуйтесь такому діапазону — він сильно залежить від місця розташування серверів та пори року.

Наприклад, Microsoft спільно з OpenAI зараз будують нові центри обробки даних в Айові — відносно прохолодному штаті, де частину води для охолодження можна замінити повітрям. Лише коли температура перевищує 29,3 °C, підключається вода. «Тож якщо ви розробляєте AI-моделі в Microsoft, то вам слід планувати своє навчання в Айові, а не в Аризоні. З точки зору навчання різниці немає. А от з точки зору споживання води чи енергії — різниця величезна», — кажуть вчені.

Дочитали до кінця? Дякуємо! Напишіть, що думаєте про наш дайджест чи запропонуйте власні ідеї для його покращення за цим посиланням. Обіцяємо прислухатися ;)

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через