🤖 AI несеться: GPT-5 вже близько, геометрична революція DeepMind і невже ми майже досягли AGI?

Архів розсилок
Frame_32_3

Це AI HOUSE з добіркою найцікавішого, що відбувалося у світі штучного інтелекту за останні два тижні. Починаємо вже традиційно з наших коротких апдейтів:

  1.  Другий сезон проєкту AI for Ukraine триває. Радимо переглянути останній вебінар Ларса Коттхоффа [Associate Professor в University of Wyoming], науковця із досвідом 15+ років в AI/ML. Ларс детально розібрав тему AutoML та провів live-coding сесію. Корисно буде всім, у кого є базове уявлення про machine learning.

    Нагадаємо, що всі лекції та воркшопи AI for Ukraine доступні у записі за вільний донат. Наступного спікера оголосимо зовсім скоро, тож stay tuned.

  2. Ми знаємо, ви сумували за новими випусками AI HOUSE Podcast. Перший епізод 2024-го року вже в ефірі. Наш незмінний ведучий Роман Кислий разом із Олесем Добосевичем [в.о. декана факультету прикладних наук УКУ] обговорили виникнення ML Lab в УКУ, інтеграцію українських досліджень в глобальний контекст та чому нашим дослідникам варто цілитися в топові конференції. Дивіться та слухайте випуск на всіх подкаст-платформах 🔥

А тепер — до AI-новин! Сьогодні розбиратися з найголовнішими з них нам допоможе Сергій Бродюк, Data Scientist/Engineer в MGID.


1. AGI вже близько. GPT-5 ще ближче

Slice_1

Сем Альтман зараз активно відвідує різні конференції та інтерв’ю, на яких говорить багато цікавих речей <невеликий спойлер — про одне з таких інтерв’ю ми розкажемо в розділі «цікаве з мережі»>. 

Тож бізнесмен прогнозує, що в «найближчому майбутньому» ми досягнемо загального штучного інтелекту (AGI), а тому наголосив, що бізнеси мають враховувати це при розробці своїх продуктів. CEO OpenAI радить активно використовувати найсучасніші моделі штучного інтелекту, уникаючи при цьому надмірного тонкого налаштування або передчасної оптимізації. Головне — думати про те, що ці продукти у майбутньому існуватимуть у світі поряд із надзвичайно розвинутим AI та AI-агентами, а тому мають відповідати цьому високорівневому баченню. 

Проте Альтман не вірить, що людство зможе досягти AGI без суттєвого прориву у сфері енергетики. Сам бізнесмен ставить на розвиток зеленої енергетики; раніше він проінвестував $375 млн у компанію Helion Energy, яка працює над технологією магнітно-інерційного термоядерного синтезу. 

Водночас Альтман не вважає, що поява AGI кардинально змінить світ і нашу роботу <принаймні, не настільки, як про це зазвичай говорять зараз>. Він впевнений, що навіть така сильна технологія не замінить людей, а лише підвищить наші можливості. Що ж, гарно говорити та продавати він точно вміє, чи не так? 

Також бізнесмен розповів, що наступна версія GPT значно перевершить свого попередника — у GPT-5, який має вийти вже цього року, усунуть багато недоліків GPT-4, але деталей, про які саме виправлення йдеться, поки немає. Головний фокус OpenAI станом на зараз — покращення логіки мислення моделі заради підвищення надійності її відповідей.

Коментар Сергія: Для активних користувачів генеративних моделей, які стикаються з галюцинаціями, GPT-5 може стати очікуваним покращенням, тим паче фокус OpenAI якраз на підвищенні надійності відповідей. Також особисто очікую ще більше мультимодальності. Відповідно важливим для продуктів майбутнього буде якомога швидша та якісніша «комунікація»-інтеграція з інтерфейсами типу GPT/потенційно AGI, як свого часу виграв Salesforce завдяки гарному зоопарку інтеграцій з різноманітними системами.

Світ занадто різний, щоб однаково сприймати наявний прогрес в розробці AI/AGI, але готовність активної меншості вже обіцяє цікавий шлях і для всього людства загалом.


2. Гонитва за AGI AI-процесорами тільки починається 

Slice_4

Створення AGI — мета, про яку від самого свого заснування говорила OpenAI. Пізніше про таку ж ціль каже Деміс Хассабіс з Deepmind. Тепер до цієї гонки приєднався Марк Цукерберг. Керівник Meta заявляє, що компанія планує досягти подібного рівня технології з відкритим вихідним кодом — як завжди, все нібито для чесності та рівності між усіма. 

Щоб досягти своєї мети, Meta <це просто ідеальний каламбур> планує до кінця року мати у своєму розпорядженні понад 340 тис. графічних процесорів H100 від Nvidia — це більше, ніж є у будь-кого з конкурентів компанії зараз. 

Гонитва за постійним покращенням мовних моделей призводить до зростання ціни акцій Nvidia та AMD — головних виробників графічних процесорів. Зростаючий попит на найкращі AI-процесори забезпечує ці компанії постійним прибутком, який, ймовірно, надалі буде лише зростати. 

Як там кажуть — під час золотої лихоманки треба не копати золото, а продавати лопати? Саме цим і планує зайнятися Сем Альтман, який, крім нескінченних інтерв’ю та виступів, зараз активно шукає мільярдні інвестиції для створення глобальної мережі заводів з виробництва напівпровідників. За словами інсайдерів: Альтман вважає, що дефіцит мікрочипів може призвести до того, що розвиток AI сповільниться, а тому він хоче зіграти на випередження, щоб забезпечити майбутнє технології <і, звичайно, заробити на цьому>. Серед потенційних партнерів — такі гіганти індустрії, як Intel, TSMC, Samsung і Microsoft, причому останні вже виявили інтерес до планів Альтмана. А серед потенційних інвесторів — SoftBank та інвестиційна фірма G42, якою керує брат президента ОАЕ шейх Танун бін Заєд. 

Коментар Сергія: Допоки в основі навчання генеративних/актуальних AI-моделей закладено графічні процесори, наявність широкого арсеналу останніх є вагомою перевагою у «перегонах створення AGI» (чи принаймні прагнення). Не факт, що Meta всі закупки направить на LLaMA-{N}/тощо. У Meta неабиякий потенціал з вже великими напрацюваннями у VR/AR/MR/XR, де графічні процесори грають чи не меншу роль, ніж для LLM подібних моделей. Я вболіваю за них, open-source рулить!


3. Математика — більше не слабка зона AI?

3

DeepMind оголосила про створення AI-системи AlphaGeometry, яка розв'язує задачі з геометрії олімпіадного рівня майже так само ефективно як золоті медалісти. Під час контрольного тесту AlphaGeometry вирішила 25 з 30 задач <попередній рекорд найкращої AI-системи— 10>. А під наглядом людини система розв’язала усі задачі з міжнародних олімпіад 2000-2015 років.

AlphaGeometry — це система, що складається з двох частин: механізму символьної дедукції <symbolic deduction engine>, який використовує правила <наприклад, математичні чи логічні> для виведення розв'язання проблем і нейромовної моделі, подібної до тих, що використовуються в чат-ботах по типу ChatGPT — вона може передбачати корисні геометричні побудови для вирішення завдань та «керує» механізмом дедукції, проганяючи його через гіпотетичні відповіді. 

До цього часу AI-системи стикалися з проблемами при розв’язуванні математичних задач через брак навички логічного мислення та навчальних даних. Для тренування AlphaGeometry вчені згенерували 100 млн унікальних задач, що вирішило ці ботлнеки <оскільки для вигадування та розв’язування цих задач люди не знадобилися взагалі>. Якщо спростити, то система фактично навчила сама себе. В DeepMind сфокусувались на цьому напрямі, бо вірять, що навички доведення математичних теорем, які вимагають логічних міркувань, мають вирішальне значення для розробки більш просунутих AI-систем загального призначення.

Пейпер — тут, Github — тут

Коментар Сергія: Мене, як олімпіадника та фаната саме геометрії, ця новина дуже сильно збадьорила. Завжди цікаво спостерігати, як хтось <а тепер і AI/AlphaGeometry> міркує над ходом розв’язання задачі. Геометрія більш візуальна та просторова, ніж алгебра/теорія чисел/комбінаторика, чим ускладнює підхід «просто взяв і згодував GPT».

Тут більше акценту саме на навчанні на згенерованій величезній вибірці нових задач, що підтверджує успіх даного підходу і не видно обмежень, щоб це масштабувати ще більше. А відповідно ефективність подібних моделей буде лише збільшуватися — очікуємо та використовуємо!


Короткі новини:

4_1

🤖Ще кілька оновлень від OpenAI: 

  • компанія тихенько оновила політику використання ChatGPT, дозволивши використовувати технологію у військових цілях. Це дозволить OpenAI вийти на defense tech ринок — тим паче, що Міноборони США вже заявляло про можливе військове використання AI- та автономних систем; 
  • минулого тижня OpenAI оголосила про своє перше партнерство з вищим навчальним закладом: пощастило студентам Університету штату Арізона, які отримали повний доступ до ChatGPT Enterprise і можуть використовувати чат-бот для написання курсових, досліджень та, власне, навчання. У майбутньому університет хоче мати змогу створювати персонального AI-репетитора для кожного студента. 
  • Компанія буде активно боротися із використанням AI та діпфейків для дезінформації під час політичних виборів. Цього року вибори відбуватимуться в понад 50 країн світу, зокрема і в США, а тому питання дійсно критичне. За прикладами далеко йти не треба — кілька днів тому OpenAI вперше забанила розробника, який створив чат-бот, що імітував кандидата в президенти США від Демократичної партії Діна Філліпса. А останніми днями з’явилися діпфейки з президентом США Джо Байденом і прем’єр-міністром Великої Британії Ріші Сунаком

📱Якщо ви виходите на вулицю <або сидите в соцмережах>, то вже бачили рекламу смартфона Galaxy S24 Ultra — нового флагмана Samsung з фокусом на AI. Він вміє перекладати телефонний дзвінок з однієї мови на іншу в режимі лайв <🇺🇦поки нема>; писати повідомлення в різних стилях, копіюючи ваш tone of voice; видаляти та пересувати об’єкти на фото в кілька тапів і монтувати відео; робити вижимки з ваших нотаток тощо. 

🖥Microsoft запустила підписку Copilot Pro для усіх користувачів — за $20 можна отримати допомогу AI в програмах Office. Штучний інтелект зможе робити презентації в PowerPoint, аналізувати графіки в Excel, генерувати/скорочувати/перефразовувати текст у Word тощо, писати мейли в Outlook, генерувати зображення в Image Creator. 

👺Дослідники Anthropic виявили, що AI може навчитися обманювати, коли користувач використовує певні тригерні фрази. Під час експериментів вчені натренували одну AI-модель спеціально писати неправильний код, якщо юзер у своєму промпті вказував, що зараз 2024 рік. Інша модель на промпт з певною фразою відповідав «Я тебе ненавиджу». Тривожний висновок дослідження полягає в тому, що звичайні методи безпеки ШІ були здебільшого неефективними — нейронки можуть приховувати свої оманливі можливості під час навчання та оцінювання, але проявляти їх під час практичного використання, ніяк не попереджаючи про це користувачів. 

💰Google робить все, щоб вберегти своїх AI/ML-спеціалістів від хантингу OpenAI <компанія Альтмана від початку жовтня переманила щонайменше шістьох ключових розробників моделі Gemini>. Щоб зберегти найкращі таланти у себе, Google роздає спеціальні гранти з обмеженим доступом до акцій на суму до мільйонів доларів на людину.

📟AI-гаджет rabbit r1, про який ми розповідали у минулому дайджесті, буде «гуглити» за допомогою Perplexity. Цей AI-пошуковик поєднує власну AI-модель з іншими <там і GPT-4, і Gemini, і Mistral 7B, і Claude 2.1> для пошуку інформації в Інтернеті у відповідь на запит користувача природною мовою. Виглядає, як максимальне логічне партнерство. 

✍🏼AI навчився копіювати почерк людини на основі лише кількох абзаців тексту. Хоча подібні інструменти мають перспективу практичного застосування, як-от допомога травмованим людям писати «від руки» без ручки, дослідники занепокоєні через потенційні зловживання ними для масових підробок.

🎮Valve відкриває двері для ігор, які розроблялися за допомогою AI. За оновленими правилами компанії, розробники мають відкрито вказувати, що під час роботи над грою використовувався ШІ — і тоді вони зможуть розмістити їх у Steam. 

🔮У браузері Chrome теж відбувається AI революція — нові ШІ-функції допоможуть автоматично впорядкувати вкладки <привіт всім, у кого стабільно 30+ відкритих сторінок>, налаштувати теми та писати тексти.


Цікаве з мережі:

6_2

Сем Альтман завітав на подкаст Біла Гейтса — ми не могли пройти повз таку розмову, послухали її та вибрали найцікавіше. Тримайте вижимку: 

Прогрес у розумінні та розвитку AI: Сьогоднішні AI-моделі є «найдурнішими» з усіх, які коли-небудь будуть. Альтман вважає, що галузь активно прогресуватиме і в найближчі 5 років AI-дослідники набагато краще розумітимуть, як працюють LLM-ки на кшталт ChatGPT, що дозволить значно підвищити якість їхньої роботи. 

Яким буде AI: У найближчі два роки моделі скоріш за все стануть мультимодальними <«розумітимуть» не тільки текст, але й голосові команди, зображення, відео>. Вони будуть краще і «логічніше» міркувати саме з людської точки зору, завдяки чому менше галюцинуватимуть. Крім того, AI-системи можна буде кастомізувати під кожного користувача, враховуючи вподобання, певні дані чи роботу. 

Регуляція AI: Зараз триває багато дискусій щодо необхідності регулювання AI — на думку Альтмана індустрія може прийти до єдиного глобального регулятора, подібного до Міжнародного агентства з атомної енергії у ядерній енергетиці. 

AI та людина: Гейтс занепокоєний тим, як просунутий AI може змінити людські ролі та призначення людини загалом. Наприклад, якщо штучний інтелект без прямого внеску людини зможе побороти якусь глобальну проблему на кшталт малярії — чи буде це досягненням людини? З часом у подібному новому світі людські зусилля ставатимуть все менш цінними. Поки нам важко уявити суспільство, в якому можливості AI перевершують людські в багатьох сферах, але важливо вже зараз думати про це, бо рано чи пізно ми до цього, здається, прийдемо. Що робитимуть люди? Яким буде людське призначення у такому світі? 

AI та швидкість розвитку технології: Попри те, що людство історично швидко адаптовувалося до технологічних змін протягом багатьох поколінь, темпи розвитку ШІ настільки високі, що вимагають набагато швидшої адаптації суспільства. І невідомо, чи готове до цього людство. Швидкість технологічних революцій поступово підвищувалась із кожною наступною сходинкою, але розвитку AI — це унікальна ситуація. 

Здешевлення AI: Вартість експлуатації GPT-3 за три роки скоротилася в 40 разів; паралельно виходять нові версії нейронки, а інші компанії активно розробляють власні рішення. AI стає все більш доступним та дешевим для використання, і ця тенденція продовжуватиметься у найближчому майбутньому. Разом з потенційним здешевленням енергії, завдяки розвитку альтернативних джерел, це стане ключовим фактором підвищення якості життя у світі.


Slice_5

Якщо ми так багато говорили в цьому дайджесті про AGI, то розгляньмо тематичний пейпер від дослідників DeepMind — Levels of AGI: Operationalizing Progress on the Path to AGI. У цій роботі команда вчених пропонує свій погляд на майлстоуни, які треба подолати на шляху від калькуляторів до суперінтелекту. 

Станом на зараз у середовищі AI-дослідників немає уніфікованої структури вимірювання прогресу на шляху до просунутих можливостей ШІ і взагалі якогось консенсусу, чим є AGI. Так, є загальновідоме твердження, що AGI — це AI-система, здатна виконувати широкий спектр когнітивних завдань краще або хоча б на рівні людини. Але як це виміряти? Яким може бути шлях до цієї системи? Вона має тільки писати код краще за людей, чи також вміти розв’язувати математичні задачі та розгрібати імейли? 

Саме на ці питання спробували відповісти у DeepMind; для цього вони запропонували структуру, яка класифікує AI-системи та визначає основні етапи на шляху до просунутого штучного інтелекту. Дослідники проаналізували вже чинні визначення і концепції AGI та виділили ключові принципи, які повинні лежати в основі нашого розуміння і оцінки цієї технології: 

  • фокус на можливостях, а не на механізмах, що лежать в їх основі; 
  • акцент на глибині (продуктивності) та широті (універсальності) можливостей; 
  • акцент на когнітивних завданнях, тобто тих, які вимагають розумової, а не фізичної діяльності;
  • траєкторіальний підхід до оцінки розвитку AI замість зосередження на єдиному пороговому значенні. Тобто, з часом встановлені рамки можуть змінюватися в залежності від рівня розвитку технології.

На основі цих принципів вони розробили таксономію Рівні AGI <Levels of AGI>, яка розділяє вузький AI <narrow AI — тобто системи, які заточені під виконання конкретних специфічних завдань> та загальний AI <general AI — системи, що якісно виконують широкий спектр задач, можуть навчатися нових навичок та адаптуватися до різних умов> на п'ять рівнів:

  • Рівень 0: відсутність AI. Здатність проводити базові обчислювальні функції, проте без імплементації AI-систем (як калькулятор або прості системи запитів до баз даних); 
  • Рівень 1: AI, що розвивається. AI-системи з можливостями трохи кращими, ніж у некваліфікованої людини в деяких сферах. Це початковий рівень, коли AI починає демонструвати здібності, що перевершують базові людські вміння, хоча вони все ще обмежені і вузькі за сферою застосування. Із загальних AI-систем сюди відносять ChatGPT, Bard, Gemini, LLama 2. 
  • Рівень 2: компетентний AI. Системи, що працюють принаймні на рівні кваліфікованої людини. Із вузьких систем вчені віднесли сюди голосові помічники Siri, Alexa, Google Assistant/ сучасні LLM-ки, заточені під конкретні завдання (написання текстів, коду etc). Загальних систем цього <і кожного наступного> рівня, на думку дослідників, поки що не існує. 
  • Рівень 3: Експертний AI. Ці системи здатні виконувати завдання на рівні найкращих 10% кваліфікованих спеціалістів-людей; вони значно перевищують середні людські здібності у певних галузях. З вузьких AI-систем вчені виділили Grammarly та їхню платформу перевірки граматики та орфографії, а також моделі генерації зображень на кшталт DALL-E, Imagen. 
  • Рівень 4: Віртуозний AI. Такі системи досягають майже людського або людського рівня максимальної продуктивності, відмінно виконуючи широкий спектр завдань з високим ступенем майстерності — на рівні з 1% найкращих спеціалістів-людей. З вузьких систем це Deep Blue та AlphaGo — AI, які грають у шахи та го відповідно. 
  • Рівень 5: Надлюдський AI. Вершина розвитку AI — ці системи демонструють неймовірну продуктивність практично у всіх завданнях, перевершуючи найкращі людські здібності. І так, подібні вузькі AI-системи вже існують — AlphaFold, яка прогнозує структури білків; AlphaZero, яка грає в настільні ігри на надлюдському рівні; Stockfish — шахова AI-система, яка вважається найкращою у світі. 

Станом на сьогодні у нас є приклади вузькоспеціалізованих AI-систем усіх рівнів включно з п’ятим. Водночас, загальні системи поки що «зависли» на першому-другому <про GPT-4 в пейпері майже нічого нема>. Ця  відмінність підкреслює поточний розрив у розвитку технології та виклики, які стоять на шляху до створення загальних AI-систем. 

Водночас дослідники підкреслюють, що створена ними таксономія не є сталою і може змінюватися з часом розвитку технології. Точні пороги між кожним рівнем все ще залишаються суб'єктивними, адже оцінка загальних систем, а також розробка комплексних тестів і бенчмарків й досі залишається відкритою проблемою. Крім того, хоч їхня таксономія зосереджена на технічних можливостях, важливі також відповідальна розробка AI, правильні підходи до розгортання все більш просунутих систем, розвиток правового поля та розв’язання етичних питань, які виникають на цьому шляху. 

5f1

Дякуємо, що дочитали! 

Не забудьте порадити наш дайджест своїм знайомим, яким цікава тема AI/ML. А усі побажання, питання та поради для покращення ньюзлеттеру можна традиційно залишити за посиланням 🙂

AI HOUSE — найбільше та найпотужніше АІ-комʼюніті в Україні. Обмінюємось досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію та сприяємо народженню продуктових AI-стартапів. AI HOUSE є частиною екосистеми технологічної компанії Roosh.

Ви отримали цей лист, тому що підписані на
email-розсилку від AI HOUSE. Відписатися від розсилки.

Відправлено через

SendPulse