🤖 AI несеться: розробка GPT-5 та AI-агенти, до яких ми не готові

На зв’язку AI HOUSE! Пропонуємо вам зануритись у найцікавіше та найважливіше, що трапилось у світі AI за останні два тижні.

Спочатку — кілька анонсів:

Відкриваємо набір на Computer Vision School: Advanced. Це інтенсивна тритижнева офлайн-школа, присвячена ключовим методам сучасного комп’ютерного зору та їх практичному застосуванню. Навчання буде корисне інженерам та розробникам/цям програмного забезпечення Middle+/Senior рівня, які спеціалізуються на впровадженні AI/ML-рішень. Серед лекторів — Ярослав Терещенко, PhD з прикладної математики, Senior CV/ML Developer у Svitla Systems, і Богдан Бобиль, Research Lead у SQUAD. Кількість місць обмежена, тому поспішайте🌪
Вчора пройшла друга лекція в рамках AI for Ukraine — подивитися запис лекції Гаеля Вароко з INRIA можна тут, а Лукаша Кайзера з OpenAI — тут. 29 листопада відбудеться воркшоп з Вікторією Олійник, яка навчить створювати якісний та, головне, етичний контент за допомогою AI — реєструйтеся > донатьте > отримуйте нові знання.
Не забуваємо про AI HOUSE Podcast! До нас завітав Микола Лук’янець, CTO та кофаундер стартапу HelloBiome. Поговорили про декодування мікробіомів, етику використання AI в Healthcare, роботу з персональними даними та інтелектуальною власністю для побудови моделей, «дорожню карту» від комітету при Мінцифрі та про те, як AI регулюють у світі. Цікавого багато, тому велком до прослуховування.
Наші друзі з Roosh стали Тиловиками Азову. Ціль: 200 000 грн, які підуть на М113. Ці бронетранспортери будуть надважливим елементом на складній ділянці фронту. Їх бронювання захистить українських захисників від кулеметів, мін і фугасів, тому потрапивши під обстріл, цілий екіпаж буде врятовано. Підтримайте банку Roosh своїм щоденним донатом.

That’s it, переходимо до новин! Розібратися з найважливішим нам допоміг Ігор Бабін, ML Lead в ADVA Soft.

1. OpenAI DevDay — це вже технологічна революція чи ще ні?

На своїй першій конференції для розробників OpenAI DevDay компанія відкрила ворота у нову еру штучного інтелекту. Видання Business Insider відзначає, що технологічне ком’юніті вже давно не бачило настільки потужного івенту з точки зору анонсів і нових продуктів.

Дивіться самі:

OpenAI оновила ChatGPT, який тепер в одному діалозі може ходити за посиланнями, генерувати зображення та аналізувати величезні документи. Компанія також анонсувала GPT-4 Turbo, розширену версію великої мовної моделі зі збільшеним контекстним вікном <з 16 до 128к токенів> та оновленою базою даних з актуальною інформацією станом на квітень 2023 року.
Завдяки GPT Builder будь-хто може створити власний чат-бот — щось на кшталт саморобних AI-агентів.
Запуск GPT Store, який в медіа вже називають Апстором майбутнього. Тут компанія збиратиме найкращі GPT-боти, створені користувачами, та платитиме їх розробникам.
Компанія запровадила «Щит від авторських прав», зобов’язавшись покривати витрати користувачів під час судових позовів щодо порушення авторських прав через використання її інструментів.

У нещодавньому інтерв’ю FT Сем Альтман підтвердив, що OpenAI вже працює над GPT-5, проте не дав жодних таймлайнів щодо випуску оновленої моделі та подробиць, якою вона буде. А вчора він заявив, що компанія тимчасово відмовляється реєструвати нових підписників ChatGPT Plus через «сплеск використання після DevDay, який перевищив наші можливості».

Зараз OpenAI запрошує до співпраці інші компанії та організації, щоб створювати нові датасети для навчання ШІ. Ініціатива спрямована на урізноманітнення даних, які зараз є дуже західноцентричними та упередженими до інших культур. До речі, під час розробки GPT-4 компанія співпрацювала з урядом Ісландії, щоб чат-бот краще відповідав ісландською мовою.

Коментар Ігоря: Поки не продакшн рівня презентацій від Apple, Сем виглядав дещо невпевненим, але за представленими новинками це, безперечно, найкраща презентація року. Цьогорічні оновлення мають не менший потенціал, ніж представлений рік тому ChatGPT, який революціонізував AI.

За цей рік з’явилося багато стартапів, які пропонують невелику обгортку над OpenAI API без додаткових можливостей. Тепер OpenAI пропонують зручнішу альтернативу, тому можна очікувати, що вже дуже скоро в GPT Store з'являться всі ті версії GPT, які були «заточені» під більш специфічні задачі.

Тренд до fairness і responsibility є дуже важливим для подальшого розвитку AI, і рішення OpenAI можуть стати стандартами для всієї індустрії — звичайно, якщо вони випустять ці інструменти в open source. Але навіть до випуску ChatGPT компанію багато критикували за те, що вона створювалась для того, щоб зробити AI більш відкритим, але поки що AI-ком'юніті має досить обмежений доступ до того, що під «капотом» GPT4, і навряд ми побачимо, що буде у GPT5. Вся надія на регулювання на державному рівні?

2. Компанія Ілона Маска xAI представила свій перший продукт — чат-бот Grok.

У компанії його описують як «бунтаря», який видаватиме «гострі» відповіді. Що це означає xAI ніяк не пояснює, але експерти вже непокояться щодо потенційних зловживань нейромережею через відсутність обмежень <або їх зменшення> щодо згенерованого контенту.

Головна фішка Grok — під час відповідей він буде використовувати інформацію з платформи X. Що насправді також лякає, враховуючи, яке це чудове поле для пропаганди, дезінформації та дискримінації. Таке вже бачення Маска.

Ну і не можемо пройти повз чудовий панч від Сема Альтмана.

Коментар Ігоря: Цікаво, що ще пів року тому Маск підписував петицію про те, що потрібно призупинити розробку AI та створити відповідні регулювання, а вже сьогодні його модель Grok виглядає менш регульованою, ніж ChatGPT на самому початку, не кажучи про все більшу відсутність регулювання в самому X.

Досить тривожним є те, що модель, ймовірно, тренувалася на даних X, яка славиться своєю токсичністю, через що можна очікувати того ж від мережі. Тому навряд хтось захоче використовувати таку не прогнозовану модель в комерційних цілях.

Але конкуренція — це майже завжди добре. Втручання інших гравців в монополію OpenAI змушує їх більше розвиватися, від чого звичайні користувачі тільки виграють. Тому готуйте попкорн, бо війна між AI (Grok vs ChatGPT) тільки починається.

3. Сьогодні стартують передзамовлення Ai Pin від Humane.

Це носимий пристрій з доступом до ШІ за допомогою голосу, жестів і вбудованого проєктора. Ai Pin кріпиться до одягу за допомогою магнітів і не має екрану. Пристрій розміром із сірникову коробку оснащений процесором Snapdragon і 32 ГБ пам’яті.

Серед функцій, про які розказали розробники, — обмін повідомленнями, прослуховування музики, переклад у реальному часі, можливість робити фото, робота з зображеннями. Є акселерометр, гіроскоп і датчик глибини. Всього у перший партії планують випустити 100 тис. Ai Pin’ів і продавати їх за ціною від $699.

Коментар Ігоря: Досить смілива та інноваційна новинка потенційно може бути більш демократичним конкурентом просторовому комп'ютингу, який Apple обіцяє випустити на початку 2024 року. Сама презентація трохи дивна, «Make me sound more excited» — одна з функцій продукту, яка буде корисна для них самих.

Поки що для мене це виглядає, як голосовий асистент, якому дали доступ до камери, мікрофону і всіх особистих даних юзера. Впевнений, що всі моделі знаходяться в хмарі, тому досить гостро постає питання приватності даних, оскільки цей пристрій може буквально постійно слідкувати за тобою, не кажучи про постійне підключення до інтернету.

Звичайно, це перша версія, яка далека від ідеалу, і несе в собі всі нюанси та проблеми роботи з поточними AI-моделями (наприклад, там далеко не 15г протеїну), але це гарний початок для розвитку подібних технологій.

Короткі новини:

🧑‍💻 Phind випускає нову AI-модель, яка кодує краще та в 5 разів швидше за GPT-4. Широке контекстне вікно <до 16к токенів> дозволяє їй обробляти складні запити. Phind побудована на основі CodeLlama-34B, яка вважається найкращою оупенсорсною моделлю для кодування.

📱 Samsung представила свою генеративну AI-модель, Samsung Gauss. Модель складається з трьох інструментів: Samsung Gauss Language <допомагає писати/перекладати контент>, Code <пише та описує код> й Image <створює та редагує зображення>. Наразі модель використовується лише всередині компанії; реліз планується з виходом та інтеграцією в Galaxy S24.

🕸 Amazon розробляє власну LLM під кодовою назвою Olympus. Повідомляється, що в Olympus буде 2 трлн параметрів, що зробить її однією з найбільших AI-моделей у світі <GPT-4 має 1 трлн>. Цікаво, що випуск попередньої моделі Titan компанія відклала після релізу ChatGPT, можливості якого «значно перевищували» розробку Amazon.

🗣 Браузери адаптують силу AI: Mozilla та Brave випустили власні чат-боти. Fakespot Chat від Mozilla допомагатиме користувачам в онлайн-шопінгу — відповідатиме на питання про продукт, шукатиме фальшиві відгуки, підказуватиме альтернативи тощо. А чат-бот Leo, який з’явився у браузері Brave, пропонує користувачам «безпрецедентну конфіденційність» — розробники обіцяють, що жодна розмова не буде записана і використана для подальшого навчання ШІ. Є також premium-версія.

🍿 Гільдія акторів США завершила найбільший за десятки років страйк, який поставив на паузу велику кількість проєктів, зокрема останній сезон Дивних Див; другий сезон Останніх з нас; Дюна: Частина друга; Гладіатор 2; нова Місія Неможлива тощо. Страйк продовжувався 118 днів через те, що актори були занепокоєні активним використанням AI-інструментів і жадали захисту на офіційному рівні від можливого впливу технології на їхню роботу.

💰 Попит на AI-таланти веде до підвищення зарплат: так, зарплати програмістів, які працюють з ШІ на 21% вищі за дохід тих, хто не має відповідних скілів. А дослідження вчених з Оксфорду прогнозує, що з часом цей відрив може становити до 40%. Найбільш корисні навички з точки зору підвищення зп: Machine Learning (+40%), Tensor Flow (+38%), Deep Learning (+27%), NLP (+19%), Data Science (+17%). Тренд підтверджує OpenAI, куди переманюють інженерів Google та Meta, пропонуючи їм мільйонні компенсації.

🖥 YouTube тестує функції на основі генеративного ШІ. Серед них — вижимки з коментарів і чат-бот, який переповідатиме відео. Вже скоро обидва інструменти будуть доступні для всіх власників YouTube Premium.

📈 Aleph Alpha залучає $500 млн серії B в одному із найбільших раундів фінансування ШІ в Європі. Компанія створює LLM-ки, схожі на GPT-4 чи Claude, але призначені виключно для використання всередині бізнесів, а не для всіх користувачів.

🎮 Microsoft реорганізовує команди Xbox та маркетингу, щоб краще реагувати на подальші AI-розробки в геймінг індустрії. Також компанія оголосила про співпрацю з Inworld AI, яка допомагатиме створювати ігрових NPC, чиї репліки буде генерувати ШІ. За задумом, це додасть реалістичності, глибини сюжету та взаємодії у відеоіграх.

AI-tool місяця — Tome.

Генеративний AI допомагає пришвидшувати рутинну роботу. Tome — якраз про це. Інструмент допомагає за лічені секунди створювати презентації, пітчдеки, резюме, портфоліо, запрошення, мудборди, сторінки для сайтів — і все це без жодних технічних скілів.

Під час реєстрації ви зазначаєте напрям своєї діяльності — так Tome потроху персоналізує ваш профіль. Ви створюєте власну студію, де зберігатимуться всі ваші роботи, обираєте колірну гамму, яка вам подобається… І все. Далі обирайте, що саме ви хочете створити, даєте необхідну інформацію і вже за кілька секунд отримуєте крутий драфт, який можна крутити під себе.

Юзери Tome відзначають, як легко ним користуватися. Особливо зручною є функція перетягування та адаптивний дизайн — виглядає дійсно магічно у порівнянні зі стражданнями, які викликав PowerPoint у свої часи. Також сподобалась функція, яка дозволяє закинути документ і отримати готову презентацію. Якщо ж готового документа нема — просто натискайте Create та напишіть, що саме вам потрібно.

З мінусів — безплатна версія дозволяє створити лише 5 «томів», на яких буде невелика вотермарка Tome. І ділитись ними можна буде лише поширивши лінк. $20/місяць ($16/місяць, якщо брати річну підписку) прибирають цю проблему — ви зможете качати створені файли у PDF-форматі або створювати кастомні лінки, стилізувавши їх під себе або вашу компанію

Цікаве з мережі:

Наш світ зараз стоїть на порозі технологічної революції. Власне, враховуючи темпи розвитку AI, ми проживаємо її зараз. Але наступний ступінь AI-еволюції має потенціал стати ще більшим геймченджером, ніж генеративний штучний інтелект.

Уявіть собі ситуацію: ви вирішили з’їздити у Львів на зимові свята. Відкриваєте смартфон, включаєте свого AI-помічника і кажете йому, що ви хочете поїхати у Львів з 23 грудня по 3 січня. І, власне, все. На цьому ваші клопоти закінчуються — програма робить все сама: купує квитки, бронює житло за вашим бюджетом, підбирає активності та ресторани, пропонує маршрути для прогулянок. І все це, враховуючи ваші вподобання.

Звучить футуристично, але саме так виглядає майбутнє <хіба що без прикладу зі Львовом — це вже наші фантазії>, яке малює Білл Гейтс. І навіть дає прогноз, що завдяки еволюції агентів на базі ШІ воно настане у найближчі п’ять років.

Про цю технологію Гейтс писав ще майже 30 років тому у книзі The Road Ahead, проте лише нещодавно технологічний прогрес досяг рівня, коли поява робочих AI-агентів є питанням часу.

Якщо ChatGPT потрібно постійно переналаштовувати, задавати йому різні промпти, додавати контекст, то агенти будуть набагато більш «високоінтелектуальними» системами. Це буквально AI-асистенти, які будуть знати про вас все. Щоб підкреслити прогрес, Гейтс порівнює сучасні AI-інструменти з потенційними можливостями AI-агентів.

Перші — зазвичай обмежені одним конкретним застосуванням, не запам’ятовують, як ви ними користуєтесь, не вивчають ваші уподобання, а тому не підлаштовуються під вас.

Другі — навчаються на ваших звичках, мультимодальні, працюють у різних застосунках, постійно вдосконалюються і, що головне, проактивні. Тобто вони здатні пропонувати певні дії ще до усвідомлення того, як вам це потрібно. Купуєте новий смартфон? Агент вже збирає характеристику бажаних моделей, читає та робить вижимку з усіх відгуків, відкинувши несправжні, порівнює ціни у різних магазинах і готовий замовити доставку додому на завтра. До речі, ви плануєте їхати у Львів, і саме в ці дати там буде концерт вашого улюбленого гурту, може, купити квитки на концерт?

Якщо ж дивитися ширше, то перспективи застосування агентів величезні: від підбору індивідуального лікування для кожного пацієнта — до персоналізованого навчання, адаптованого під потреби конкретної людини.

Це не просто зміна правил гри для користувачів. Це революція для всієї технологічної індустрії <а може і всього світу>. Агенти стануть новими платформами, на яких будуватимуться сервіси та програми. Причому робити це зможуть навіть люди без технічних умінь.

«Вони замінять пошукові сайти, бо зможуть краще знаходити інформацію та узагальнювати її для вас. Вони замінять багато e-commerce сайтів, оскільки знайдуть для вас найкращу ціну і не будуть обмежені лише кількома постачальниками. Вони замінять генеративні AI-інструменти, електронні таблиці та різні програми для підвищення продуктивності. Бізнеси, які сьогодні існують окремо, стануть єдиною галуззю», — пише Гейтс.

Він підкреслює кілька проблем майбутньої технології. Як створити великі та потужні бази даних нового покоління, які здатні розуміти та запам'ятовувати дані користувачів? До того ж треба подумати про конфіденційних цих даних. А як агенти мають взаємодіяти — особливо якщо запити їхніх власників суперечать один одному? Що робити з дезінформаційними AI-агентами та AI-хакерами майбутнього? Чи потрібно людям взагалі буде навчання та робота, якщо всі питання може вирішити програма?

Суспільство, технологічні компанії, уряди — весь світ рано чи пізно стикнеться з цими викликами. Агенти вже близько, і вони докорінно змінять наше життя. А тому ми маємо готуватися до цих змін вже зараз.

Дякуємо, що дочитали!

Не забудьте порадити наш дайджест своїм знайомим, яким цікава тема AI/ML. А усі побажання, питання та поради для покращення ньюзлеттеру можна традиційно залишити за посиланням 🙂

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через