Google запустив Gemini AI: це 'найкращий у світі' штучний інтелект, який змусить GPT-4 пасти задніх
Доки тривають дискусії, чи треба продовжувати масові експерименти зі штучним інтелектом і чи несуть вони загрозу людству, компанія Google зробила свій хід. Вона запустила нову модель ШІ, яка отримала назву Gemini. За заявам розробників, вона може перевершити як модель OpenAI GPT-4, так і людей "експертного рівня" у низці тестів інтелекту.
Як пише видання New Scientist, про існування Gemini генеральний директор компанії Аphabet Inc. та її дочірньої компанії Google Сундар Пічаї розповів у травні. На том момент модель перебувала у стадії навчання. А зараз її представили публіці.
Наразі Gemini доступна у трьох версіях: Nano, Pro і Ultra, які відрізняються розміром та можливостями. Найменша з трьох – Nano призначена для локального запуску на смартфонах. Вона має дві версії. Одна працюватиме на повільніших телефонах і має 1,8 мільярда параметрів, а інша працює на більш потужних пристроях і має 3,25 мільярда параметрів. Про кількість параметрів Pro і Ultra, їхній розмір, а також масштаб або джерело даних навчання у Google відповідати відмовились. Для порівняння: з чуток відомо, що GPT-4 включає до 1,7 трильйона параметрів, а LLAMA-2 від Meta – 70 мільярдів.
За твердженням Google, середня версія Gemini, яка має назву Pro, перевершує деякі інші моделі, такі як OpenAI GPT3.5. А от "найстарша" в лінійці Ultra перевершує можливості всіх існуючих моделей ШІ. Вона вперше зуміла обійти у стандартному тесті MMLU людину, набравши 90%. Відомо, що людина "експертного рівня" очікувано набирає в цьому тесті 89,8%. Тест включає широкий спектр складних питань з тем, включаючи логічні помилки, моральні проблеми у повсякденних ситуаціях, медичні питання, економіку та географію.
У тому ж тесті GPT-4 набрав 87%, LLAMA-2 – 68%, а Claude 2 від Anthropic – 78,5%. Gemini перевершила всі ці моделі у восьми із дев'яти інших поширених тестах продуктивності.
В компанії повідомили, що модель Pro буде інтегрована в Bard від Google – онлайн-чат-бот, запущений у березні цього року. А на початку 2024 року вийде версія Bard Advanced, яка включатиму ще більшу модель – Gemini Ultra.
На сьогоднішній день нова версія Bard буде доступна англійською мовою більш ніж у 170 країнах. Однак скористатись нею буде неможливо у Великобританії та Європі. За словами Сіссі Сяо з Google, затримка пов'язана з регулюванням, а не з розробкою: "Ми працюємо з місцевими політиками та регулюючими органами, щоб переконатися, що ми дотримуємося місцевих законів та інших подібних речей, перш ніж запускати в інших регіонах", – повідомила вона.
У свою чергу Елі Коллінз з Google DeepMind назвала Gemini найбільш потужною моделлю компанію і при цьому найбільш універсальною. За словами розробників, її можна адаптувати до різних завдань. Вона навчена сприймати як текст, так і звук і надавати вихідні дані у різних форматах. Однак на даному етапі запуск Bard дозволить використовувати лише текстові підказки. Очікується, що звукова взаємодія та робота із зображеннями мають стати доступними у найближчі місяці.
На презентації не було представлено жодної версії Gemini для тестування, але Google продемонстрував запис того, як їхній ШІ допомагає робити домашні завдання та працює з відеовходом у реальному часі. В компанії також запевнили, що нова модель краще розробляє програмне забезпечення, ніж попередні версії. Відомо, що торік підрозділ Google DeepMind випустив генератор коду на основі штучного інтелекту під назвою AlphaCode. Розробники запевняють, що він може перевершити половину розробників-людей. Оновлена версія на базі Gemini, за твердженням компанії, може обійти в кодуванні 85% програмістів-людей.
Раніше OBOZ.UA розповідав, коли, на думку колишнього гендиректора Google, штучний інтелект перетвориться на загрозу людству.
Підписуйтесь на канали OBOZ.UA в Telegram і Viber, щоб бути в курсі останніх подій.