🤖 AI несеться: AI Act і Україна, культ ШІ у Кремнієвій Долині, Midjourney йде у веб

AI HOUSE на зв’язку! Трохи затрималися з технічних причин, але вже виправляємося та повертаємося до вас із добіркою найцікавішого, що відбувалося у світі штучного інтелекту за останні два тижні.

До кінця року залишилося зовсім трохи, а цей восьмий дайджест стане останнім у 2023-му. Дякуємо всім, хто нас читає, шерить знайомим та підтримує! Тримайте кілька нагадувань та апдейтів від нас:

Другий сезон проєкту AI for Ukraine триває, останній вебінар 2023 року провела Софі Дейлі — Staff Data Scientist в Stripe. Радимо переглянути його в записі, адже Софі детально поділилася lessons learnt під час першого застосування LLM-ок в компанії.
Всі лекції та воркшопи AI for Ukraine доступні у записі за вільний донат.
Є час переглянути, поки чекаємо наступних виступів зірок AI/ML індустрії у 2024-му.
Це місце вже традиційно присвячене AI HOUSE Podcast. Самі не віримо, що відзняли цілих 14 випусків з надзвичайними експертами ком’юніті. Наш незмінний ведучий Роман Кислий обговорює з гостями українські та світові практики у сфері ШІ, власні кейси <вдалі та не дуже> і те, як ми знаходимо спільну мову з машинами. Дивіться та слухайте на всіх подкаст-платформах, особливо, якщо пропустили якийсь із випусків🔥
Корисне нагадування — третій воркшоп UNLP відбудеться онлайн 25 травня 2024 року на базі LREC-Coling 2024. Чому ми говоримо про це зараз? Бо подачу пейперів вже відкрито, кінцевий термін — 1 березня 2024 року. Тож всі, хто працює у сфері NLP та комп’ютерної лінгвістики, з акцентом на українську мову, — долучайтеся.
Якщо ж ви досліджуєте тему боротьби з дезінформацією за допомогою AI, тоді подавайте свої пейпери до тематичної добірки, яку буде опубліковано групою журналів Frontiers of AI та BigData. Зазвичай подібні публікації можуть коштувати до $2к, проте Альянс Когнітивної Безпеки в партнерстві з Frontiers in AI покриє всі видавницькі витрати для авторів з України. Якщо у вас є запитання чи ви готові відправити своє дослідження — напишіть Людмилі Хантсман, фаундерці Cognitive Security Alliance та Editorial board member у Frontiers.

А тепер — до AI-новин! Сьогодні розбиратися з найголовнішими з них нам допоможе Олександр Косован — Head of Data Science в ExpoPlatform та ментор AI HOUSE CAMP 2023.

1. AI Act — довге та важливе рішення. Для України зокрема.

Майже три роки дебатів — і от нарешті ЄС погодили проєкт закону AI Act, комплексний підхід до регулювання сфери штучного інтелекту. Угода, яку називають «першою у світі», встановлює суворі правила і заборони на використання ШІ у деяких напрямах, зокрема у біометричній категоризації, розпізнаванні емоцій, соціальній оцінці та маніпулюванні людською поведінкою.

Законодавці розробили багаторівневу систему, що класифікує AI-застосунки за ступенем ризику. «Високоризикові» AI-системи підпадають під найбільш обтяжливі регуляторні обмеження. Під додаткове регулювання підпадають AI-системи загального призначення по типу ChatGPT. Водночас оупенсорс зможе дихати вільніше — для цих моделей пролобіювали значні послаблення у регулюванні; зрештою, Європа не хоче відставати технологічно через занадто жорсткі обмеження.

Водночас повну силу AI Act набуде не раніше 2026 року — до цього буде поетапне його впровадження. Для України AI Act важливий тим, що саме на нього планують орієнтуватися українські законодавці. Міністр цифровізації Михайло Федоров говорив, що з наступного року в Україні будуть готувати проєкт закону, аналогічного до європейського AI Аct, реалізацію якого планують завершити до 2027 року.

Коментар Олександра: Тема регулювання є складною, незалежно від того чи це стосується АІ, чи економічних відносин. В темі регулювання завжди важливо зберігати баланс між свободою та контролем. Як тільки ми втратимо цей баланс, то опинимося в новій серії «Чорного дзеркала».

Свобода у сфері АІ є дуже важливою, оскільки саме це дало можливість дійти до поточної точки прогресу. Особливо це важливо в академічних дослідженнях, що допоможуть впоратися з майбутніми викликами, а їх буде багато. З іншої сторони, цією свободою можуть скористатися корпорації для монополізації ринку чи шахраї для своїх потреб.

Контролювання не можна ігнорувати ще через те, що є багато сфер, де впровадження АІ має низку ризиків. Наприклад, якість згенерованого тексту та поставленого діагнозу перебувають на різних рівнях впливу на добробут людини. З іншого боку надмірний контроль може заважати подальшому розвитку сфери та переходу деяких технологій в «тінь».

Ще одним важливим аспектом так званого «AI Act» є перенесення поняття АІ в юридичну площину, що є чудовим кроком у збереженні верховенства права у технологічному світі. Підсумовуючи, неможливо сказати однозначне «так» або «ні» в темі регулювання АІ, але я схиляюся до європейського бачення цієї теми. Нам необхідно бути гнучкими, оскільки світ мінливий — і кому як не нам про це добре відомо.

2. Google активно пушить свою модель Gemini

Google розкритикували за фейкове демо відео нової моделі Gemini. Вони трохи змахлювали, щоб показати роботу LLM-ки кращою та швидшою, ніж вона є насправді. Та і перші тести показали, що розрекламовані можливості були трохи перебільшеними. Згідно з новим дослідженням, Gemini Pro працює +- на рівні GPT 3.5; вона любить галюцинувати, пише код з помилками та навіть може відмовитись робити самарі на контроверсійну тему, натомість запропонувавши користувачу погуглити самостійно <докладніше — тут і тут>. Проте завдання з перекладу даються їй краще, ніж тому ж GPT .

Все це не заважає компанії імплементувати нову модель у свої продукти <а що ще їм залишається, чи не так?>. Gemini Pro тепер доступна через Gemini API; тим часом Google запустили Google AI Studio — платформу, що дозволить створювати різні інструменти за допомогою текстових підказок та легко інтегрувати ці рішення для розробки застосунків. Також Gemini імплементують у Duet AI for Developers — гуглівський конкурент GitHub Copilot. Конкурентна перевага Google — партнерство з 25 компаніями, які надали власні набори даних для покращення розробки інструменту.

Також Google прокачала свою AI-платформу для розробки Vertex AI — тепер там працює «найсучасніша» text-to-image технологія для генерації зображень Imagen 2, яка може кинути виклик DALL-E 3 та Midjourney.

Паралельно компанія представила MedLM, сімейство GenAI-моделей, адаптованих для медичної галузі. Вони мають допомогти підвищити ефективність та пришвидшити роботу медпрацівників — зокрема ведення записів про історію хвороб пацієнтів, а також виявлення, класифікацію та ранжування нових біомаркерів.

Коментар Олександра: Google безперечно є супер технологічною організацією, котра хотіла відкусити шматок ринку користуючись WOW-ефектом. Шкода, але підхід «fake it till you make it» не працює там, де існують конкурентоздатні рішення. Виглядає, що всі AI інновації Google спираються на екстенсивний розвиток <більше даних, більше обчислень>, не розв'язуючи наявні проблеми індустрії. Однозначно, нові моделі від Google знайдуть свою нішу, але схоже, що амбіції корпорації вперлися в сувору конкурентну реальність.

3. Mistral AI випустила найкращу безплатну AI-модель

Французький стартап Mistral AI продовжує розривати ринок оупенсорсу. Компанія оголосила про закриття Series A раунду в розмірі $415 млн з оцінкою у $2 млрд. Серед інвесторів — a16z, NVidia і Salesforce. І все це за компанію, якій трохи більше ніж пів року.

Нова розробка Mistral показує, чому такі інвестиції — це не просто хайп. Компанія випустила нову LLM-ку Mixtral 8x7b, яка відповідає <або перевершує> Llama 2 70B і GPT3.5 у більшості бенчмарків, водночас працюючи швидше за них.

Це стало можливим завдяки інноваційній структурі моделі — Mixture of Expert (MoE). Якщо коротко, то всередині Mixtral 8x7b є вісім маленьких LLM-ок, кожна з яких спеціалізується на певних тематиках. Коли користувач пише промпт, вони «радяться» між собою, яка ж з них зрештою відповідатиме безпосередньо на запит, що дозволяє економити ресурси моделі. Затестити Mixtral 8x7b можна тут або тут.

Mixtral 8x7b працює з англійською, французькою, італійською, німецькою та іспанською мовами, вміє кодити та «витончено обробляє» (яке гарне формулювання від розробників) 32к токенів.

Також компанія запустила в беті власну API-платформу для розробників La plateforme, пропонуючи доступ до генеративних моделей з різною продуктивністю та вартістю.

Коментар Олександра: На мою думку, саме open source був та буде рушієм прогресу сфери, тому це чудово, що серед можливих технологічних рішень є Mixtral 8x7b від Mistral AI. Концепція самої моделі є цікавою, я думаю, що акцент на оптимізації обчислювальних потужностей та експерименти з архітектурою (MoE) можуть бути конкурентними перевагами. Mistral AI має всі шанси стати лідером сфери, але ринок та час дадуть найкращу оцінку їхній моделі.

Що ще нового у світі AI:

🤖 Пачка апдейтів від OpenAI:

Компанія випустила гайд по промпт-інжинірингу GPT4. Дуже радимо приділити час і почитати <або попросити GPT зробити вижимку, хехе>. Тим паче, що OpenAI нарешті повернули можливість купівлі платної версії ChatGPT;
Тепер ваші діалоги з GPT можна архівувати, щоб приховати їх з меню <замість того, щоб видаляти>
Користувачі жалілися на знижену якість роботи ChatGPT. Дехто пояснював проблему так званою «гіпотезою зимових канікул», згідно з якою чат-бот ставав більш лінивим через наближення зимових свят <тому що так зазвичай роблять люди>;

Останніми днями пишуть, що ChatGPT «раптом чомусь знову став дуже хорошим». Настільки, що навіть пішли чутки, що OpenAI тихенько проапгрейдили GPT до версії 4.5 <все почалось нібито через «злитий» скрін з описом нової моделі>. Альтман відкинув всі припущення, проте офіційний акаунт ChatGPT в X підлив масла у вогонь загадковим повідомленням:

👾 Stable Diffusion випустили модель Stable Zero123, яка може створювати 3D-об’єкти з зображень. А Google разом із дослідниками Стенфордського університету та Технологічного інституту Джорджії представили AI-систему W.A.L.T., здатну генерувати відео і навіть створювати послідовний 3D-рух з текстових промптів чи зображень.

👨‍🎨 Midjourney виривається з клітки Discord і запускає альфа-версію вебплатформи для генерації зображень зі зручним інтерфейсом. Поки що доступ є у тих, хто нагенерував >10к зображень. Крім того, сама модель отримала оновлення V6 Alpha. Щоб протестувати оновлену модель, напишіть в Discord /settings і виберіть V6 у випадаючому меню або введіть --v 6 після промпту. А тут можна поглянути на порівняння результатів v5.2 і 6.

🧩 Microsoft випустила модель Phi-2 — потужну LLM-ку з 2,7 млрд параметрів, яка може працювати на ноутбуках і смартфонах. Тести показують, що Phi-2 працює краще за більшість моделей з більшою кількістю параметрів <наприклад, моделі Mistral і Llama 2 з 7 млрд параметрів чи нова Gemini Nano 2 від Google з 3 млрд параметрів>.

🎸 GenAI-застосунок Suno імплементували в Microsoft Copilot — тепер там можна генерувати повноцінні AI-треки з текстами та інструментами.

🖼 У відкриту бету вийшов чат-бот Vercel v0, який за кілька секунд генерує дизайн вебінтерфейсу за текстовим описом. Спробувати можна тут.

🎙 Audiobox — нова модель від Meta, яка генерує голоси та звукові ефекти за допомогою тестових та голосових підказок. Компанія запрошує спільноту долучатися до подальших досліджень і виділяє на це гранти. Пейпер — тут, демо — тут.

🔐 Gmail отримала «найбільше оновлення системи безпеки за останні роки» — це AI-інструмент RETVec, який відстежує текстові маніпуляції, притаманні спам-повідомленням. Це різні спецсимволи, емодзі та омоніми, що можуть проходити звичайні спам-фільтри. Впровадження RETVec покращило рівень виявлення спаму в Gmail на 38% і зменшило кількість помилкових спрацьовувань на 19,4%.

🕶 Meta розповіла про AI-асистента для розумних окулярів Ray-Ban. Він може розпізнавати об’єкти <і, наприклад, підібрати вам штани, які пасують під сорочку>, перекладати мову в режимі реального часу, слухати навколишній світ і робити вижимку з отриманої інформації. В NYTimes вже називають цю розробку «новою ерою спостережень».

🥷 Компанія ByteDanсe <розробник TikTok> таємно <ну чи вже не дуже> використовувала технологію OpenAI для створення власної LLM. Журналісти отримали доступ до внутрішнього листування китайської компанії, де співробітникам наказували приховувати докази шпіонажу, використовуючи методи десенсибілізації даних. Після цього OpenAI забанила акаунт ByteDance, проте поки що відкритим залишається питання, чи піде тим же шляхом Microsoft, адже китайці використовували GPT через платформу Microsoft Azure, а не через OpenAI напряму.

🎧 Spotify тестує AI-generated плейлисти. Користувачі зможуть вводити власні запити або вибирати із заздалегідь запропонованих промптів, а штучний інтелект зробить плейлист, який надалі можна буде редагувати. Коли функція стане доступною для всіх, поки невідомо, проте журналісти впевнені, що це станеться вже незабаром.

📺 Наступного року запуститься Channel 1 — перший news-агрегатор, який адаптуватиме під кожного користувача буквально все, від тематики до стилю подачі новини. Щоб уникнути дезінформації та фейків <або хоча б мінімізувати їхню кількість> усі інфоприводи будуть збиратися з традиційних ЗМІ, фрилансерів, дописів у соцмережах та урядових документів.

🧠 Наостанок — кілька крутих досліджень від DeepMind:

AI-система FunSearch від DeepMind перевершила людей-математиків у розв’язанні комбінаторних задач, натхненних картковою грою Set. FunSearch автоматично створює запити для спеціально навченої LLM на створення невеликих програм, які генеруватимуть розв’язання певних задач. Потім система швидко перевіряє, чи є ці розв'язки кращими за відомі. Якщо ні, вона надає зворотний зв'язок LLM, щоб він міг покращити свою роботу в наступному раунді. На відміну від інших програм зі штучним інтелектом, методи FunSearch є прозорими, що дозволяє математикам вчитися на рішеннях, згенерованих штучним інтелектом. Ловіть пейпер.
Інше дослідження показало, що штучний інтелект може імітувати людські навички соціального навчання в режимі реального часу, не покладаючись на попередньо зібрані людські дані. AI зміг не тільки вивчити та засвоїти нові навички у тестовому середовищі, але й застосовував набуті знання у нових ситуаціях і зберігав їх навіть за відсутності «експертів», які навчали систему.

AI-tool місяця

Тут ми трохи змахлюємо — і замість одного AI-інструменту дамо дещо інше.

Дуже часто перед початком роботи з ChatGPT нам потрібно дати йому величезний промпт, щоб описати як йому act as someone, задати стиль/формат/структуру відповіді, дати нейромережі контекст тощо. Частково цю роботу полегшили кастомні GPTs, проте доступ до них мають лише користувачі преміумверсії ChatGPT, шукати їх поки що незручно та і модерації ніякої немає, щоб розуміти, які чат-боти працюють добре, а які — ні.

Сервіс FlowGPT частково виправляє цю проблему. Тут власний чат-бот може створити кожен юзер, а інші оцінюють його роботу. Один із користувачів під новий рік зібрав величезну добірку найефективніших промптів. Теми абсолютно різні — маркетинг, дослідження, саморозвиток, дата-аналітика тощо.

Щоб побачити сам промпт — перейдіть на чат, який вас зацікавив і натисніть ViewPrompt. Випробувати кожен можна одразу в прикріпленому чат-боті <або скопіюйте його і пограйтеся у своєму ChatGPT>. Автор обіцяє, що з часом список тем промптів буде розширюватись, тому рекомендуємо зберегти цю добірку на майбутнє 😉

Цікаве з мережі:

AI-культ у Кремнієвій Долині розділив людей. Ви за кого — «прискорювачів» <accelerationists> чи за «гальма» <decel>?

NY Times та Bloomberg написали про новий рух, який поступово захоплює Кремнієву долину. Питання та дискусії, які він підіймає, можуть визначити подальший розвиток та, можливо, навіть кінець людства.

Ефективне прискорення <Effective Accelerationism>, яке скорочують до e/acc <вимовляється як «і-ак»> — це новий рух, який прагне беззастережного технологічного прогресу. Його прибічники стверджують, що AI та інші технології мають розвиватися якнайшвидше, без жодних бар'єрів чи регулювань, які нібито заважають інноваціям. Вони впевнені, що потенційна користь від AI значно переважає шкоду, а тому найкраще рішення — це не заважати технології зростати.

Рух також запозичує праці британського філософа Ніка Ленда, який багато років тому писав, що сили капіталізму та штучного інтелекту врешті-решт зіткнуться в «технокапіталістичній сингулярності» — точці, в якій технологія випередить нашу здатність її стримувати <щоправда нещодавно Ленд потрапив у немилість через підтримку ультраправих ідей>.

Ефективний акселераціонізм розпочався як зухвала відповідь старому, більш усталеному руху — Ефективному альтруїзму <Effective Altruism, EA>, який останніми роками став одержимим ідеєю забезпечити безпечне створення штучного інтелекту, щоб він не вийшов з-під контролю і не знищив людство. Через це деякі експерти закликають до регулювання і навіть призупинення розвитку технології. Їх в e/acc називають decels, doomers та safetypilled <«гальма», «приречені» та складна конструкція, яка приблизно означає «ті, хто прийняв безпекові таблетки»>. Так, технологічна індустрія дуже любить придумувати свій жаргон.

Рух сформувався та розвинувся в X <Twitter> минулого року, а з часом перемістився в офлайн, з вечірками та хакатонами в районі Сан-Франциско та за його межами. З часом рух набрав обертів у Кремнієвій долині, а про нього заговорили навіть чиновники у Вашингтоні. Серед відомих людей, які підтримують e/acc — CEO і президент Y Combinator Гаррі Тан, інвестор-мільярдер Марк Андрессен (який у жовтні опублікував величезний маніфест про технооптимізм, у якому він пояснює, що рух відкидає такі ідеї, як «екзистенційний ризик» і «сталий розвиток») та, можливо, Сем Альтман, який жартував у реплаях та підписаний на засновника руху в X.

Більшість людей, звичайно ж, хочуть зберегти існуючі форми життя і не готові поступатися місцем штучному інтелекту та роботам. Багато дослідників стверджують, що без належних запобіжників AI може призвести до непередбачуваних і, можливо, катастрофічних наслідків.

Розкол формується навіть серед технологічних венчурних інвесторів. Коли генеральний директор General Catalyst Гемант Танеджа (Hemant Taneja) написав в X про свою підтримку «відповідальної» розробки ШІ, інші венчурні інвестори розкритикували його. «Ні, дякую», — написав Ендрю Чен, партнер в Andreessen Horowitz.

Битва між e/acc та «Ефективними альтруїстами» — один із нових квазірелігійних розколів, що сьогодні виникають на айті-сцені Сан-Франциско. Зараз дослідники активно сперечаються, як швидко прогресують технології та чи готові ми до нових технологічних стрибків.

А ви хто, Прискорювач чи Альтруїст?

Дякуємо, що дочитали!

Не забудьте порадити наш дайджест своїм знайомим, яким цікава тема AI/ML. А усі побажання, питання та поради для покращення ньюзлеттеру можна традиційно залишити за посиланням 🙂

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через