🤖AI несеться: лонч GPT Store, доленосний позов проти OpenAI та комп’ютери з ШІ

AI HOUSE на зв’язку! Перший ньюзлеттер цього року вже тут. Сподіваємося, ви добре відпочили та готові дізнаватися що ж нового несеться у світі AI/ML. Нам не терпиться поділитися, але традиційно почнемо з кількох апдейтів:

1. Другий сезон благодійного проєкту AI for Ukraine триває 🇺🇦
Зустрічайте наступного спікера — Дата Дарила Нґо, ML Solutions Architect в Arize AI, експерт із досвідом 10+ років в AI/ML. Дат проведе вебінар на тему «Arize LLM Observability, How To and Best Practices».

ML-інженер(к)и, Data Science-спеціаліст(к)и, приєднуйтеся до трансляції 18 січня о 19:00, щоб зануритися в оцінювання LLM, роботу з RAG та дебагінг. Таке не варто пропускати, тож реєструйтеся та прокачуйте скіли за благодійний донат.

2. Ініціативи та подкасти AI HOUSE & Roosh — у шортлісті премії DOU. Якщо слухаєте та хочете підтримати нас – залишайте свої голоси за освітній проєкт AI for Ukraine та за AI HOUSE Podcast & Hey Roosh. Дякуємо🫂

Ну все, погнали до AI-новин! Сьогодні розбиратися з найголовнішими з них нам допоможе Богдан Бобиль — Research Lead у SQUAD, викладач факультету компʼютерних наук та кібернетики в КНУ ім.Тараса Шевченка.

1. Медіа та штучний інтелект — союзники чи вороги?

New York Times <NYT> подала позов проти OpenAI та Microsoft, звинувативши їх у масових порушеннях авторських прав.

У позові стверджується, що для навчання чат-ботів використовувались «мільйони статей» видання, а бізнес-модель AI-продуктів побудована на масовому порушенні авторського права. Щоб це підтвердити, фахівці NYT перевірили відкриті версії датасетів, на яких навчалася GPT-3, і показали приклади, коли чат-бот надавав користувачам майже дослівні уривки зі статей NYT, які були закриті пейволом. Видання визначає ChatGPT та інші AI-системи, як потенційних конкурентів у медійному бізнесі. Тепер NYT вимагає виплати збитків, компенсації, покриття витрат і заборони використовувати їхній контент для навчання.

В OpenAI пояснюють, що створювати круті моделі по типу ChatGPT без використання матеріалів, захищених авторським правом, банально неможливо — схоже, що саме це буде ключовою позицією для захисту в суді. Компанія стверджує, що якщо у навчанні використовувати лише відкриті дані, то такі AI-системи будуть «неадекватними». Крім того, компанія стверджує, що NYT гралися з промптами, щоб змусити ChatGPT цитувати матеріали видання у своїх відповідях — для цього журналісти могли або прямо просити чат-бот цитувати статті або відбирати потрібний результат після багатьох діалогів з нейромережею. З усім тим, в OpenAI сподіваються на подальшу «конструктивну» співпрацю з NYT.

Рішення суду у цій справі буде важливим прецедентом для майбутнього медіабізнесу та генеративного AI, тому слідкуємо.

Цікаво, що деякі ЗМІ вже уклали угоди про використання їхніх журналістських матеріалів для навчання AI-моделей: у липні Associated Press домовилось з OpenAI, а німецький видавець Axel Springer, якому належать Politico і Business Insider, зробив те ж саме наприкінці 2023-го. За це компанія Альтмана пропонує $1-5 млн щорічно — більшість видавців вважають це малою сумою, через що OpenAI важко шукати партнерів.

Подібну співпрацю з Condé Nast <видавець Wired, Vogue, GQ, The New Yorker та ін.> і NBC News планує Apple, яка зараз розробляє власні AI-моделі. Журналісти дізналися, що «яблучна» компанія пропонує більшу суму, ніж OpenAI, проте хоче використовувати матеріали ЗМІ не лише для навчання ШІ, а і «у будь-який інший спосіб, який компанія вважатиме за необхідне». Реакція видавців поки неоднозначна — деякі з них занепокоєні власне юридичною відповідальністю за використання їхнього контенту з боку Apple. Саме тому кейс NYT vs OpenAI такий важливий.

Коментар Богдана: Інформація та дані завжди були цінним ресурсом. Цілком очевидно, що останні десятиліття ця цінність постійно зростала і дуже ймовірно, що даний процес продовжиться. Причинами цього є як запит суспільства на приватність, так і поява все більшої кількості способів монетизації доступної інформації різними суб'єктами.

У випадку з OpenAI vs NYT, позиції сторін цілком зрозумілі: NYT є правовласником контенту і має право розпоряджатися ним на свій розсуд, але і для AI-компанії медіа є важливим джерелом даних, яке нерозумно ігнорувати. Є певні сумніви, що медіа та AI-компанії найближчим часом стануть союзниками, проте партнерство <хоча б ситуативне> цілком можливе. Обом бізнесам є що запропонувати одне одному — медіа щонайменше отримають додатковий дохід за свій контент <а, можливо, в перспективі — й ефективні інструменти для створення нового контенту>, а AI-галузь — доступ до даних. Тобто простір для компромісу є.

Але є й інші, поки гіпотетичні, опції для компаній, що займаються генерацією контенту — самим стати гібридними медіа. Адже, якщо вони готові платити мільйони, а можливо і десятки мільйонів доларів за права на контент існуючим гравцям, то що завадить їм рано чи пізно самим інвестувати в створення цього контенту, наймаючи журналістів та публіцистів, які робитимуть це вже напряму для них? Це питання ефективності та вигідності, рано чи пізно хтось з гравців спробує, і в когось може вийти. І це може стати додатковим аргументом для класичних медіа, щоб піти на партнерство, а не конфронтацію. Хто знає? Якщо деякі IT-гіганти почали входити в кіно- та телебізнес, то чому вони не захочуть спробувати себе у медіа?

2. 2024-й — рік початку глобального синтезу AI та комп’ютерів?

Віцепрезидент AMD Джейсон Банта прогнозує значне збільшення кількості ПК зі штучним інтелектом у цьому році <найбільше зростання він очікує у 2025-му>. Банта впевнений, що з'являтимуться все більше невеликих AI-моделей, що працюватимуть безпосередньо на комп’ютерах.

Прогноз підкріплюється останніми діями Microsoft та Google, які невдовзі готуються презентувати свої перші «AI-ПК» — Surface Pro 10 та Surface Laptop 6 від Майків і Chromebook Plus від Гугла. Компанії обіцяють, що комп’ютери нового покоління зможуть прогнозувати та краще розуміти побажання юзерів, самостійно виконуватимуть прості завдання та, звичайно, будуть максимально персоналізованими, що має підвищити продуктивність користувачів.

Крім того, ноути від Microsoft можуть отримати спеціальну кнопку Copilot на клавіатурі, яка викликатиме чат-бот Windows Copilot, вбудований у Windows. Він відповідатиме на запити та виконуватиме певні дії всередині компа. А повноцінні можливості AI розкриються з виходом Windows 12, який має дебютувати до середини 2024-го. Своєю чергою ноут від Google дасть користувачам доступ до великої кількості AI-апок та функцій <так, чат-бот теж має бути>.

Масла у вогонь підливає й NVIDIA, яка представила нові відеокарти GeForce RTX SUPER для ПК та інші інструменти, адаптовані під роботу з AI. Їх будуть встановлювати у нові комп’ютери Acer, ASUS, Dell, HP, Lenovo, MSI, Razer і Samsung, що виходитимуть цього року та «піднімуть взаємодію зі штучним інтелектом на новий рівень». Крім того, компанія представила AI Workbench, який скоро вийде в бету. Цей інструмент дозволяє розробникам взаємодіяти напряму з AI-моделіями на Hugging Face і GitHub.

Коротше, ще трохи — і замість використання мишки та клавіатури ми, здається, просто говоритимемо з ноутбуками.

Коментар Богдана: Навряд чи інтеграція AI-рішень в операційні системи стане проривом, щонайменше в короткій перспективі. Причиною цього є спосіб використання ПК більшістю користувачів — це перегляд контенту, комунікація, розваги та робота. І в багатьох випадках доведеться якимось чином інтегруватися в інші продукти, розроблені іншими компаніями, які можуть бути зацікавлені, або не зацікавлені у даному функціоналі.

У короткій перспективі компанії зможуть тільки покращити існуючий функціонал для масового користувача — краще рекомендувати контент, швидше шукати інформацію, кращий super-resolution, в якихось випадках — автоматизувати рутину. Цікавішим був би ринок створення спеціалізованих рішень для дизайнерів, програмістів, контент-мейкерів, дослідників та інших, але цей ринок менший і працювати з ним складніше — багато спеціалістів в даних областях вже використовують AI у своїй роботі та здатні самі знайти та налаштувати інструменти під себе. Однозначно можна сказати, що компанії зараз знаходяться у ситуації, коли їм потрібно створити ринок для масового користувача, а не покрити існуючу потребу і запити, а цей шлях завжди сповнений спроб, помилок та завищених очікувань.

3. OpenAI запустила GPT Store, а ChatGPT пам’ятатиме про вас усе <якщо ви того захочете>.

Спільнота вже створила понад 3 млн кастомних GPTs: тепер в магазині їх можна сортувати та шукати найцікавіші для вас. Також компанія обіцяє щотижня хайлайтити найкорисніші GPT та запустити систему винагород для розробників вже у першому кварталі. Ось топчики першого тижня:

Персоналізовані рекомендації щодо маршрутів — AllTrails;
пошук і синтез результатів з 200 млн наукових робіт — Consensus;
прокачка навичок кодування від Khan Academy — Code Tutor;
асистент у створенні презентацій — Canva;
пошук наступної книги, яка вам сподобається — Books;
AI-репетитор з математики та природничих наук — CK-12 Flexi.

Також деякі користувачі вже отримують сповіщення, що ChatGPT буде вчитися та запам’ятовувати контекст їхніх діалогів. Це допоможе персоналізувати досвід кожного кристувача фактично перетворюючи чат-бот на персонального асистента, який знатиме контекст усіх ваших бесід. Водночас з’являється функція тимчасових чатів — це щось типу режиму інкогніто в браузері, який не зберігає історію переглядів — так і ChatGPT не пам’ятатиме переписку у цих діалогах.

Коментар Богдана: Однозначно, запуск GPT Store — це позитивна новина для галузі. Він дасть змогу зацікавленому ком'юніті не тільки експериментувати, а й розповсюджувати свої моделі, що позитивно вплине на розвиток цієї області, в першу чергу — на пошук способів застосування технології. Загалом, від цього можуть виграти всі — як розробники, так і бізнеси, що мають бажання підвищити ефективність, або автоматизувати свої бізнес-процеси.

Також це може дати можливість дрібним гравцям та індивідуальним котриб'юторам розповсюджувати свої напрацювання, хоча все залежатиме від методів рекомендації в самому магазині та на кого робитимуть основну ставку в самому OpenAI — на великих гравців з великими рекламними бюджетами та медіаресурсом чи на допомогу меншим компаніям і розробникам.

Що ще нового у світі AI:

🧠З’явилися чутки, що Google невдовзі запустить Bard Advanced на базі своєї топової AI-моделі Gemini Ultra, яка <як очікується>, буде мультимодальною і конкуруватиме з GPT-4 за можливостями. Цей Bard буде платним, але з тримісячною безплатною пробною версією. Також говорять про інструмент під кодовою назвою «Motoko», де користувачі зможуть створювати власних ботів <щось типу GPT Store>. Що ж, чекаємо.

📱17 січня відбудеться презентація нових Samsung Galaxy S24. Очікується, що на івенті компанія детально розкаже про можливості нових смартфонів зі штучним інтелектом. За чутками, AI підсилить камеру <особливо зйомку в темряві>, дасть можливість видаляти чи додавати об’єкти на зображення одним дотиком, записувати та моментально транскрибувати до 10 голосів одночасно в текст, також говорили про функції генеративного редагування тексту та моментального перекладу мови.

🐰 На технологічній виставці CES 2024 представили AI-гаджет rabbit r1. Ідея проста: використовуючи голосові команди ви можете замовляти таксі, купувати квитки, шукати цікаві місця тощо, не дістаючи для цього телефон зі своєї кишені.

🌐Автоматизація наступає все швидше: Google може скоротити частину підрозділу з продажу реклами, де працює близько 30 тис. спеціалістів. AI-інструменти на кшталт Dynamic Search Ads і Performance Max зменшили потребу в людській праці, оскільки вони автоматизують пропозиції та створення оголошень у всіх сервісах Google. Duolingo також скорочує близько 10% позаштатних працівників, оскільки все більше контенту для компанії створюється за допомогою AI.

🍏Apple у співпраці з дослідниками Колумбійського університету випустила мультимодальну оупенсорсну AI-модель Ferret. Це знаменує вихід компанії на ринок ШІ з відкритим кодом, що змінює її традиційний підхід. Паралельно Apple розробила метод HUGS <Human Gaussian Splats> для створення анімованих 3D-аватарів з коротких відео. А в іншому нещодавньому пейпері дослідники Apple розв’язали ключову проблему розгортання LLM на пристроях з обмеженою пам'яттю, що потенціально дозволить створити умовну AppleGPT.

💻GitHub Copilot Chat тепер загальнодоступний для всіх + апка Copilot з’явилась на iOS та Android. Застосунок дає безоплатний доступ до GPT-4 від OpenAI, а чат-бот зафайнт’юнений спеціально під розробників, які можуть отримувати підказки від ШІ в режимі реального часу.

📹Цього місяця Midjourney планує почати навчання нової моделі, яка буде створювати відео за текстовими запитами. Повноцінний запуск продукту планується протягом наступних місяців. Тим часом в X шириться список з майже 5 тис. художників, чиї роботи використовувалися для навчання AI-генераторів зображень Midjourney, Stability AI, DeviantArt та Runway AI.

🤖 Вчені зі Стенфордського університету та компанії DeepMind створили робота-домашнього асистента, який вміє готувати, прибирати, заправляти білизну тощо. Робот навчався, «спостерігаючи» за людьми — в середньому йому потрібно близько 50 демонстрацій кожного завдання, щоб вивчити послідовність рухів та мати змогу їх копіювати з ефективністю 90%. До речі, схожого робота, який вчиться, повторюючи за людьми, показала компанія Figure AI — цей вміє заварювати каву і навіть виправляти свої ж помилки під час цього процесу.

💉Вчені з MIT відкрили перші нові антибіотики за останні 60 років за допомогою штучного інтелекту. Дослідники називають це «значним досягненням у боротьбі з антибіотикорезистентністю» — стійкості бактерій до антибіотиків — яка є причиною смерті понад мільйона людей на рік. Дослідження, проведене за допомогою ШІ, успішно виявило сполуки, ефективні проти метицилін-резистентного золотистого стафілокока та ванкоміцин-резистентного ентерокока, на які сучасні антибіотики вже майже не діють.

🐲Чат-бот Ernie, розроблений найбільшою китайською інтернет-компанією Baidu, вже має понад 100 млн користувачів — на це пішло менше ніж пів року. Для порівняння — ChatGPT набрав 100 млн юзерів за два місяці, проте його, на відміну від Ernie, міг використовувати будь-хто з невеликими обмеженнями, які згодом зняли; водночас для реєстрації у китайському чат-боті потрібен китайський номер телефону.

🔮Дослідники з Технічного університету Данії розробили AI-модель life2vec, яка може передбачати важливі події в житті людей, включаючи час смерті. Модель, навчена на медичних і соціально-економічних даних 6 мільйонів данців, використовує моделі-трансформери, подібні до ChatGPT, для систематичної організації та аналізу послідовностей подій у житті людей.

🔐Дослідники з Наньянського технологічного університету навчали чат-боти <серед яких ChatGPT, Google Bard та Microsoft Bing Chat>, щоб «зламувати» один одного і створювати контент, який порушує рекомендації їхніх розробників. У такий спосіб вони створили LLM-ку Masterkey, яка автоматично створює промпти для джейлбрейку чат-ботів. Дослідження виявило значні вразливості в нейромережах. Masterkey навчився аналізувати невдалі промпти та покращувати їх, щоб постійно створювати нові, більш ефективні підказки для джейлбрейку. Пейпер тут.

💰Трохи про інвестиції:

Perplexity, яка розробляє однойменний AI-пошуковик, залучила $73,6 млн у нещодавньому раунді фінансування, підвищивши свою оцінку до $520 млн. Раунд очолив венчурний фонд IVP. Серед янголів-інвесторів — Джеф Безос, CEO Shopify Тобі Лютке, співробітники Nvidia.
Anthropic планує залучити $750 млн — раунд очолить венчурний фонд Menlo Ventures, а вартість компанії виросте до $18 млрд.
OpenAI веде переговори про залучення нового раунду фінансування, після якого вартість компанії перевищить $100 млрд, що зробить її другим найдорожчим американським стартапом після SpaceX. Також OpenAI хоче залучити $8-10 млрд для проєкту з виробництва мікрочипів під кодовою назвою Tigris.
Miltech компанія Shield AI, яка розробляє AI-системи для управління безпілотниками різних класів, залучила $100 млн в рамках Series F та $200 млн боргових коштів від Hercules Capital. Флагманський продукт компанії — Hivemind, автопілот на базі ШІ, який може керувати групами БПЛА і виконувати місії автономно в умовах підвищеної небезпеки, без потреби в операторах і прив’язки до GPS.

Цікаве з мережі:

Китай підсилює свої шпигунські можливості завдяки хакерським атакам і викраденим AI-технологіям.

У липні 2018 року в аеропорту Сан-Хосе американські правоохоронці заарештували Сяоланга Чжана, колишнього співробітника Apple. Його звинуватили у крадіжці комерційної таємниці, пов'язаної з програмою автономного водіння Apple. Цей інцидент є лише частиною величезної боротьби між США і Китаєм за першість у сфері AI.

Американці дедалі більше занепокоєні через використання Китаєм AI у масштабних операціях зі збору даних і хакерських атаках проти американців. Можливості Пекіну у сфері AI стають все більш загрозливими — нещодавно американська розвідка попереджала про загрози зі сторони Китаю, що виходять далеко за рамки крадіжки інтелектуальної власності. Директор ФБР Крістофер Рей розповів, що Китай вже деякий час використовує AI для підсилення своїх кібератак, збираючи та накопичуючи дані про американців у неможливих раніше масштабах. «Зараз вони використовують наші ж технології проти нас», — каже він.

У американській розвідці впевнені, що китайські хакери активно використовують AI-системи, щоб «просіювати» різноманітні датасети, серед яких є як урядові, так і банківські та страхові бази, щоб відстежувати американських шпигунів під прикриттям і чиновників, які мають доступ до секретної інформації. Скомпрометованими може бути багато конфіденційних даних — відбитки пальців, закордонні контакти, медичні записи, паспортні дані, — а AI нібито допомагає Китаю звести всю цю інформацію в єдину базу для подальшого відстеження цільових осіб.

Президент Microsoft Бред Сміт розповів, що під час атаки на поштові сервери компанії у 2021 році, яку пов’язують із Китаєм, активно використовувався AI. «Ми побачили чіткі ознаки дуже специфічного таргетингу. Тому ми маємо припускати, що AI і надалі використовуватиметься для вдосконалення та поліпшення атак», — пояснює він.

«За допомогою AI Китай може створити досьє практично на кожного американця — з деталями від медичних записів і номерів паспортів до номерів кредитних карт й іменами та адресами батьків і дітей. Візьміть цю інформацію, додайте кілька сотень тисяч хакерів, які працюють на китайський уряд, і ми отримаємо страшну потенційну загрозу національній безпеці», — каже Глен Герстелл, колишній головний юрисконсульт Агентства національної безпеки.

У Китаї заперечують свою причетність до хакерських атак на американські мережі, натомість називаючи США «найбільшою хакерською імперією і глобальним «кіберзлодієм» у світі.

Останніми роками ФБР змістила акцент на захист виробників мікрочипів, необхідних для обробки AI-програм, менше фокусуючись на власне AI-компаніях. Це пояснюється тим, що навіть якщо алгоритми ШІ будуть викрадені, досягнення в цій галузі можуть зробити ці викрадені системи застарілими за достатньо короткий період.

Зараз американські технологічні лідери сфокусовані на тому, щоб зробити з AI не тільки кіберзброю, але й потужний захисний елемент. Чи вийде у них — покаже лише майбутнє.

Чим займається Superalignment team у OpenAI: як компанія хоче запобігти тому, щоб суперінтелект вийшов з-під контролю.

Компанія оголосила про формування Superalignment team у липі 2023-го. Її головна задача — пошук способів контролю над майбутнім сильним штучним інтелектом <AGI>, можливості якого з часом перевищуватимуть людські. Створення саме такої системи ставить собі за мету OpenAI, а тому робота Superalignment team вважається ледь не найважливішою у компанії. Команда вивчає способи узгодження цих просунутих AI-моделей з людськими намірами та можливістю контролювати ШІ.

Нещодавно команда Superalignment поділилася першими результатами свого дослідження — вони вивчали метод, коли менш потужна AI-модель контролює більш потужну. Робота відбувалася у турбулентні часи для компанії <йдеться про історію зі звільненням-поверненням Сема Альтмана>.

Під час експерименту дослідники використовували олдову GPT-2 для контролю та навчання GPT-4. Команда хотіла зрозуміти, чи можна методи, якими контролюють AI-моделі «людського» рівня, використовувати на більш потужних моделях. Для цього вчені порівняли результати двох GPT-4 — одну навчала друга версія LLM-ки, а інша навчалась на правильних відповідях.

Результати виявилися неоднозначними — попри те, що «нова» GPT-4 дійсно працювала краще за GPT-2, вона не розкрила весь свій потенціал. Це вказує на те, що цей підхід потребує подальшого вдосконалення. Проте навіть такий результат був «дивовижним і позитивним», адже він вказує, що у цього підходу є майбутнє.

Критики такого методу контролю стверджують, що GPT-2 занадто обмежена, щоб ефективно навчати та перевіряти роботу більш просунутих моделей. Також такий підхід не враховує ризиків того, що суперінтелект може приховувати свої справжні можливості або наміри, що створює значні проблеми для superalignment-стратегій.

У OpenAI визнають, що тема є дуже комплексною, а тому запрошують до співпраці зовнішніх дослідників та установи. Щоб цьому посприяти, компанія оголосила про створення фонду в розмірі $10 млн для підтримки досліджень у сфері superalignment, пропонуючи гранти та стипендії для заохочення подальшої роботи в цій галузі. Подаватися на отримання цих грантів можна до 18 лютого.

Дякуємо, що дочитали!

Не забудьте порадити наш дайджест своїм знайомим, яким цікава тема AI&ML. А усі побажання, питання та поради для покращення ньюзлеттеру можна традиційно залишити за посиланням. Архів попередніх випусків тут 🙂

62457148b76596a41eaa0921_2WDSnSsBS_XgJ3AVziCmfv5rdfN5BE3qx6EZVp4EKqu12XUIMEbvYkWhnnlehEoiDnpA-09-4_JG6yGnhgEyefTmlPmI9n5BHAZ9uj5jInn2GCgDVvlNYMF0UofWaa60XQ4VngKL

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через