🤖 AI несеться: Claude в Україні, революція в медицині та аудіофейки

AI HOUSE на зв’язку! Уже традиційно почнемо з невеликого смолтолку про нас, адже в нас є цілих дві круті новини:

Разом з Roosh запускаємо другий сезон проєкту AI for Ukraine. Для тих, хто не знає — це серія воркшопів та лекцій від топових міжнародних експертів та експерток зі сфери AI/ML на підтримку українського технологічного ком’юніті під час війни. Серед спікерів AI for Ukraine. Season 2 — Лукаш Кайзер з OpenAI, Гаель Вароко з INRIA, Хасіб Кхан з Google, Софі Делі зі Stripe та Вікторія Олійник з Оксфордського Університету. Список буде поступово поповнюватись новими гучними іменами, тому слідкуйте за апдейтами. Записи першого сезону та більше подробиць дивіться тут.
Це місце зарезервовано для нового AI HOUSE Podcast — особливо, якщо це спеціальний епізод, який ми записували офлайн на IT Arena! Крім незвичного формату, у нас був спеціальний ведучий — Богдан Пономар, кофаундер і CEO в Gathers та Board Member в AI HOUSE, — і гість — Олександр Борняков, заступник Міністра цифрової трансформації. Говорили про штучний інтелект і державу: про AI-стратегію України, нашу співпрацю з іншими країнами, штучний інтелект у сфері оборони, автоматизовану службу підтримки. Також роздумували, чи допоможе AI в судових процесах та відповідали на запитання з залу та від нашого комʼюніті.

Нещодавно в Україні створили дорожню карту регулювання штучного інтелекту, а тому епізод прям максимально актуальний!

Так поступово ми переходимо до новин. Сьогодні розбиратися з найголовнішими з них нам допоможе Олександр Зарічковий, Head of Research у SQUAD, одному з найбільших R&D-центрів України.

1. Вийшов щорічний State of AI Report.

State of AI Report — величезний <понад 150 слайдів> звіт, який допомагає розібратися, що відбувається в індустрії. Якщо без нашого дайджесту ви не встигали за потоком новин у 2022 та у першій половині 2023 року — цей документ спеціально для вас.

Ключові висновки дослідників:

AI стимулює науковий прогрес, особливо в медицині;
GPT-4 — найкраща LLM серед конкурентів як у класичних бенчмарках, так і в іспитах, призначених для оцінювання людей;
даних, створених людьми, скоро буде недостатньо, щоби покращувати роботу AI. Дослідження показують, що проблеми можуть виникнути вже у 2026 році, коли <гіпотетично> вичерпається запас високоякісних мовних даних;
обчислення — нова нафта, а тому NVIDIA генерує неймовірні прибутки, поки США починає «чипові війни» з Китаєм;
GenAI рятує венчурний світ, оскільки компанії, які працюють над GenAI-застосунками та рішеннями, залучили понад $18 млрд за неповний 2023-й рік
<за весь 2022-й були рекордні на той час $3,9 млрд>;
на перший план вийшли розмови про безпеку AI — як наслідок компанії та уряди країн активно працюють над регуляцією сфери. Проте процесу не допомагають глибокі розбіжності всередині світової AI-спільноти, про які ми писали в минулому дайджесті.

Думка Олександра: Особисто для себе я б назвав 2023-й рік — роком ChatGPT. Його реліз у відкриту бету наприкінці 2022 сколихнув науковий та бізнес світи. Ініціативні люди швидко знайшли йому застосування: від розв'язання шкільних завдань і складання іспитів до покращення рекомендацій у пошукових системах або створення цифрових клонів людини, що відповідають на вхідні повідомлення.

Заміни класичних пошукових систем <як це пророкували наприкінці 2022> на ChatGPT не відбулося. Насамперед через можливість галюцинації моделі та видачі видуманої інформації, що здається правдивою. Саме на цьому полі було зроблено безліч досліджень з використання ChatGPT як у фішиногових кампаніях, так і з захисту від них. Чого лише вартує фейкове повідомлення про теракт біля Пентагону. Уже зараз можна достеменно сказати, що ми переходимо до фази створення регуляцій AI-технологій, що дещо обмежить швидкість розвитку AI-застосунків, але закладе фундамент стійкого <sustainable> розвитку технології.

2. Adobe анонсувала купу нових фіч на своїй щорічній конференції MAX 2023.

Оновлення стосуються роботи AI із зображеннями, відео, аудіо й навіть 3D-моделями.

Серед найхайповіших релізів — оновлений генератор зображень Firefly. Уже можна спробувати бета-версію Firefly Image 2, яка натренована на значно більшій кількості зображень <+70%>, ніж її попередник. А нові моделі, представлені на конференції, допоможуть ще якісніше працювати з вашим результатом. З цікавого хочемо відзначити:

Project Stardust дозволяє дуже легко вибирати, редагувати та видаляти об’єкти за допомогою текстових промптів;
Project Draw & Delight вміє малювати векторні малюнки з будь-яких <навіть дуже поганих> нарисів;
Project Dub Dub Dub, який вміє перекладати запис аудіо на інші мови, зберігаючи інтонацію та голоси тих, хто говорить;
Project Res Up, який допомагає апскейлити відео;
Project Fast Fill — генеративна заливка для відео, де ви просто вибираєте, що треба змінити в певній галузі відео, і AI це робить.

Думка Олександра: Новинки від Adobe не є чимось проривним у галузі генеративного АІ, але вихід на ринок застосунків від такого гіганта свідчить про зрілість технології та користь для кінцевих користувачів <які готові платити за ці новинки чималі гроші>. Це вже не звичайні шматки технології, а повноцінний продукт, який ми зможемо використовувати разом з наявними продуктами від Abode. А отже, якість контенту <будь то зображення чи відео> вийде на новий рівень разом зі зменшенням кількості зусиль на його створення.

3. AI революціонізує медицину

Ми вирішили винести окремо цей висновок зі State of AI Report, оскільки за два тижні трапилось одразу кілька цікавих подій, які ілюструють майбутній прогрес у сфері.

Вчені з Нідерландів створилили AI-систему Sturgeon, яка допоможе швидше та якісніше діагностувати пухлини головного мозку. Sturgeon сканує сегменти ДНК пухлини, щоб отримати детальну інформацію про її тип і підтип. Ця інформація допомагає хірургам приймати рішення про те, як саме оперувати пацієнта, а в майбутньому — дозволить підбирати лікування, адаптоване до конкретного підтипу пухлини.
У Google Cloud створили AI-інструмент для медичних працівників, який може агрегувати медичну інформацію з різних баз даних, медичних карток та відсканованих документів з посиланням на оригінали. Це допоможе зекономити час та сили людей — дослідження показують, що на кожну годину, проведену з пацієнтом, лікар витрачає ще дві години на адміністративну роботу + годину-дві на додаткову канцелярську роботу.
Дослідники з Гарвардського та Оксфордського університетів розробили AI-інструмент EVEscape, який може прогнозувати нові варіанти вірусів. Зокрема, зараз вчені вже вивчають з його допомогою віруси SARS-CoV-2 <коронавірус, який спричиняє ковід>, а також віруси ВІЛу та грипу. У системі міститься детальна інформація про віруси, а також модель еволюційних послідовностей, яка передбачає їхні можливі варіанти еволюції. Це допоможе медикам у розробленні ефективних вакцин і нових методів лікування.

Думка Олександра: Розділ медицини та біотехнологій пройшов поза радарами у 2023, хоча прогрес у генеративному AI впливає на сектори не менше, ніж на наше повсякденне життя <а, можливо, навіть більше>.

COVID показав, що біотехнології виходять на перший план у розрізі розробки та впровадженні новітніх рішень у медицині. Наразі вони можуть використати напрацювання зі штучного інтелекту та впровадити їх у свої дослідження для пришвидшення розробок. Це може бути від звичайної автоматизації <як у кейсі з новиною від Google Cloud>, так і до генерації нових штамів вірусів <кейс із Гарвардського та Оксфордського університетів> або аналізу ДНК послідовностей. Загалом нас очікує багато <гарних> новин із цієї сфери.

Короткі новини:

🇺🇦 Claude став доступним для України. Чат-бот від Anthropic, який вважається головним конкурентом ChatGPT, може похизуватися значно більшим контекстним вікном <100к токенів замість 8к>, завдяки чому Claude може працювати з великими текстами на кшталт книг чи наукових досліджень.

🎨 DALL-E 3 тепер генерує зображення всередині платних версій ChatGPT. Тепер непотрібно навіть писати промпт — просто опишіть моделі, що вам треба, а чат-бот сам згенерує запит і зображення. Бонус: тримайте пейпер по DALL-E 3.

🖼 AI-пошук в Google тепер може генерувати зображення та дає змогу користувачам створювати чернетки. І якщо друге не дуже цікаво, то перше точно звучить перспективно. Але відмовлятись від Midjourney/DALL-E/Firefly зарано, адже нова функція доступна лише для користувачів у США, Індії та Японії.

🇨🇳 Китайська Baidu випустила оновлену версію Ernie AI. За словами CEO компанії, Ерні «ні в чому не поступається GPT-4». Ефективність роботи Ernie 4.0 ще не оцінена, проте Baidu вважається чимось на кшталт синтезу Google та OpenAI на китайському ринку — абсолютним лідером пошукових систем та на ринку генеративного AI. Паралельно Baidu інтегрує штучний інтелект в інші свої продукти — Baidu Drive і Baidu Maps.

📈 Якщо ви думаєте, що AI-хайптрейн скоро затихне — то ні. Компанія Gartner випустила дослідження, згідно з яким вже у 2026 році 4 з 5 компаній по всьому світу використовуватимуть Gen AI. Тобто за три роки кількість компаній, співробітники яких користуватимуться штучним інтелектом, виросте у 16 разів — з нинішніх 5% до 80%. З огляду на можливі галюцинації та неточності — основи роботи з AI будуть ледь не найприбутковішими курсами в найближчі роки.

📜 AI розшифрував стародавній сувій із давньоримського міста Геркуланум. Вчені не могли прочитати документ, який пошкодило виверження вулкана Везувій у 79 році — того самого, що поховав Помпеї. Алгоритм, розроблений 21-річним студентом Люком Фаррітором, може допомогти розшифрувати ще сотні текстів із єдиної неушкодженої бібліотеки, що збереглася з часів греко-римської античності, та навіть записки від ваших лікарів!

⭐️ AI вперше знайшов наднову без допомоги людини. Алгоритм Bright Transient Survey Bot натренували на майже 1,4 млн знімках неба. 5 жовтня він переглядав дані телескопа в режимі реального часу та помітив наднову SN2023tyk, а 7 жовтня підтвердив її існування, підтягнувши дані з іншого телескопа. Астрономи в захваті — за останні шість років вчені витратили приблизно 2200 годин на пошуки і класифікацію наднових. Інструмент має потенціал вивільнити купу часу дослідників на виконання інших задач, що прискорить наукові відкриття.

🤖 DeepMind представила модель Open-X Embodiment — універсальний AI, який може керувати різноманітними роботами. Раніше вчені намагалися створити власну нейромережу для кожного робота, проте єдина універсальна архітектура виявилася набагато кращою за спеціалізовані. Вже скоро роботи будуть навчати один одного, як махати руками та писати звіти.

🧩 NVIDIA представила Masterpiece X — Gen AI-платформу для створення 3D-моделей з тексту. «Усе, що вам потрібно — клавіатура, браузер, трохи уяви та кілька слів», — кажуть розробники. Зараз платформа працює з обмеженнями, проте потенціал очевидний — Masterpiece X може стати чимось по типу Midjourney на максималках, яке будуть активно використовувати розробники ігор або віртуальних світів.

🖥 Війна чипів набирає обертів — США планують запровадити обмеження на використання AI-чипів для китайських компаній. У Білому домі хочуть відрізати Пекін від передових технологій і вповільнити розроблення китайських AI-систем через напружені геополітичні відносини між країнами.

😈 Хочете обійти цензуру ChatGPT? Спробуйте використовувати менш поширені мови. Дослідники з Браунського Університету змогли уникнути 79% обмежень, звертаючись до чат-бота кельтською та зулуською мовами. Якщо спростити, їхній висновок приблизно такий: OpenAI вдалося зацензурувати англійську <вченим вдалося обійти менш ніж 1% обмежень>, проте інші мови набагато краще підходять, щоб розговорити ChatGPT на неетичні теми. Попри можливі зловживання, дослідники вважають, що спільнота має знати про цю проблему заради прискорення поліпшення безпеки AI.

🗣 Український AI-стартап Respeecher відтворив голос померлого актора Мілогоста Речека <Miłogost Reczek>, який зіграв Віктора Вектора у відеогрі Cyberpunk 2077. Розробники з CD Projekt Red найняли іншого актора, який записав нові репліки, а потім звернулися до Respeecher, щоб накласти на записи голос Речека, зберігши всі його особливості.

Стартапи, що надихають:

Зараз майже вся взаємодія з AI зосереджена в онлайні або залежна від потужного комп’ютера. Проте деякі компанії вже шукають способи розмістити AI-систему всередині невеликого пристрою та гаджетів. Нова ера розумних окулярів і кулонів уже близько.

Humane: Стартап, очолюваний колишнім співробітником Apple Імраном Чаудрі, нещодавно показав свій AI Pin. Це автономний пристрій, який можна чіпляти на одяг, оснащений низкою різноманітних датчиків, які можуть збирати різну інформацію та записувати розмови. Подробиць поки небагато, проте вже 9 листопада планується офіційна презентація AI Pin — там і побачимо, на що здатен цей девайс.

Чим цей стартап чіпляє, так це гучною самопрезентацією. Компанія постійно приховувала, над чим вона працює, але попри те активно залучала кошти. Наприкінці 2020 року Humane закрила Раунд А на суму $30 млн за оцінкою в $150 млн. У вересні 2021 року раунд B приніс компанії $100 млн, а серед інвесторів були Tiger Global Management, SoftBank Group, BOND, Forerunner Ventures та Qualcomm Ventures. А в березні цього року Humane залучила ще $100 млн. У компанію проінвестував також Сем Альтман, а OpenAI допомагає технічній команді Humane в роботі зі штучним інтелектом. Тому сподівання відповідні — це має бути щось вау.

Зараз компанія активно тизерить свій продукт — наприклад, на Паризькому тижні моди його носила супермодель Наомі Кемпбелл, що зробило її «першою людиною за межами компанії, яка носила пристрій на публіці».

Rewind.ai: Компанія працює над девайсом, який міг би стати ключовим для якоїсь серії Чорного дзеркала.

Rewind Pendant коштує всього $59 — за ці гроші можна отримати кулон, який записуватиме всі ваші розмови та передаватиме їх вам на смартфон. AI аналізує, сортує і витягує важливу інформацію з усього потоку, а також транскрибує звук у текст.

Кулон може автоматично створювати вам списки справ на основі ваших розмов, фіксувати спонтанні ідеї під час прогулянки, аналізувати голосові патерни для визначення настрою та багато іншого — на що вистачить фантазії, що зробити з аудіозаписами вашого дня.

Круто? Страшно? Як реагувати не знає поки ніхто, проте розробники вже розповідають про privacy-first підхід до використання продукту, який “гарантує, що ніхто не буде записаний без їхньої згоди”. Що б це не значило :)

Окрім кулона, RewindAI запустила застосунок Rewind для macOS, який описується як «пошукова система вашого життя». Програма дає змогу користувачам відтворювати все, що вони бачили, чули або говорили. Всі записи зберігаються на комп’ютері — доступ до них має лише користувач. Розробники хваляться своїми технологіями стиснення файлів, що дає змогу зменшувати їхній розмір без значної втрати якості.

Цікаве з мережі

Ну і якщо в цьому випуску ми так зосередилися на темі AI-генерації голосу, варто розказати про потенційні проблеми цієї технології. Тим паче, що про це пишуть і NY Times, і Washington Post.

Експерти давно передбачали, що генеративний штучний інтелект призведе до величезної кількості фейкових фото та відео. До аудіо людство виявилося неготовим <хоча й не сказати, що з іншими фейками ми справляємося краще>.

За кілька днів до парламентських виборів у Словаччині, що пройшли минулого місяця, у місцевих соцмережах почав активно розповсюджуватися аудіозапис. На ньому голос лідера Прогресивної партії країни Міхала Шимечки описував схему фальсифікації результатів голосування та розказував про запланований підкуп виборців. Зрештою, партія Шимечки програла вибори партії проросійського політика Роберта Фіцо.

Ще один «інноваційний» політичний скандал виник у Великій Британії. Соцмережею X ширився аудіозапис, на якому лідер лейбористської партії Кір Стармер сварився на свого співробітника, використовуючи брудну лайку.

Обидва записи пізніше були визнані як фейкові та згенеровані за допомогою AI. Це чудово, проте далеко не всі з тих, хто ділиться таким контентом у своїх соцмережах, знає про висновок експертів — і сприймає записи за правду. Особливо, якщо автор фейку постарається і дасть якісний опис, який зрезонує з думками користувача. Самі ж платформи не поспішають модерувати подібний контент — аудіофейки швидко розповсюджуються, набирають мільйонні перегляди та збирають сотні тисяч лайків. Just business.

Зростання кількості якісних аудіопідробок, згенерованих штучним інтелектом, посилює кризу недовіри та дезінформації. З кожним місяцем технологія стає все більш досконалою, легкою в користуванні та дешевшою. Експерти попереджають, що такий розвиток подій може призвести до серйозних наслідків — від маніпуляцій на виборах <як ми бачимо на прикладі Словаччини> до пропаганди насильства.

Із законами теж нічого не ясно — уряди країн поки не знають що робити з регуляцією AI загалом; генерація голосу — лише частина проблеми, яка поступово виокремлюється в окремий трек. Минулого тижня американські посадовці оголосили про розроблення законопроєкту No Fakes Act, який передбачає покарання за створення або розповсюдження згенерованої AI копії людини в аудіовізуальному або голосовому записі без її згоди. Проте це лише перший крок — від реально розв'язання проблеми ми ще дуже далеко.

Є ідеї, як покращити ньюзлетер? Напишіть їх сюди.

PS. Після останнього випуску нам прилетіло туди кілька крутих ідей, тому не соромтесь — пишіть, ми все читаємо. І дякуємо за багато приємних слів, це додає наснаги 🙂

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через