На I/O 2024 компанія Google представила нові функції для своєї платформи штучного інтелекту Gemini AI, які зараз поступово стають доступними. Завдяки GEMS, системі тематичних ШІ-помічників, та Imagen 3, вдосконаленому генератору зображень, Google демонструє, як штучний інтелект можна використовувати персоналізовано та етично відповідально. У цій статті ми детальніше розглянемо нові функції, сфери їх застосування та пов'язані з ними виклики.
GEMS: сфокусовані чат-боти зі штучним інтелектом для індивідуальних потреб
GEMS - це спеціальні версії АІ-асистента Gemini. Вони дозволяють користувачам створювати експертів для конкретних тем або завдань, які точно відповідають їхнім потребам. Ви можете самі визначити цих персоналізованих чат-ботів, і вони запам'ятовують, про що ви вже говорили і в якому контексті. Це дозволяє їм підтримувати вас у виконанні повторюваних завдань. Концепція в цілому схожа на GPT від Open AI та проекти Anthropic.
GEMS доступний для користувачів Близнюків, які використовують версії Advanced, Business або Enterprise. Користувачі можуть визначати специфікації, наприклад, цілі, правила поведінки та цілі застосування. Існує також кілька готових Gems, які допоможуть вам розпочати роботу - наприклад, як навчальний посібник, творчий партнер, консультант з питань кар'єри, асистент з написання текстів або партнер з кодування. Ці готові Gems можна використовувати безпосередньо, і вони полегшують ознайомлення з тематичними AI-помічниками.
Imagen 3: вдосконалена генерація зображень з підтримкою ШІ
Imagen 3 знаменує повернення ШІ-генератора зображень від Google, який тепер (знову) може створювати зображення людей, хоча і з деякими обмеженнями. Imagen 3 тепер генерує зображення набагато краще і різноманітніше. Крім того, АІ тепер може створювати зображення в різних стилях - від повністю реалістичних зображень до художніх інтерпретацій. Ця функція доступна всіма мовами, які підтримує Google, і базується на технології водяних знаків SynthID від Google. Це означає, що ви можете бути впевнені, що контент, створений ШІ, дійсно походить від нього.
Варто зазначити, що Google відновив генерацію зображень людей після проблем з цим раніше.
Щоправда, поки що лише англійською мовою. Це означає, що безкоштовна версія Gemini також має доступ до загальної генерації зображень, але без розширених функцій для зображень людей.
У попередніх версіях, наприклад, ШІ неправильно зображував історичних діячів. У Imagen 3 Google хоче виправити такі неточності. Зображення відомих людей або неповнолітніх, а також надмірне зображення насильства або неприйнятного контенту більше не заборонені.
Gemini Live: майбутнє взаємодії зі штучним інтелектом у реальному часі
Незважаючи на те, що Gemini Live наразі доступний лише англійською мовою і за підпискою, Google обігнав варіант Chatgpt, який застряг в альфа-тестуванні, і чинить тиск на Open Ai, щоб мати можливість взаємодіяти зі штучним інтелектом у реальному часі за допомогою голосу. З Gemini Live відповіді в майбутньому мають стати ще більш динамічними та контекстуалізованими.
Крім того, межа між машинним і людським спілкуванням ще більше розмивається. Ця функція може бути особливо корисною, коли йдеться про швидке реагування на запити, наприклад, у сфері обслуговування клієнтів або в навчальних середовищах.
Ціни та доступність
Більшість нових функцій наразі доступні лише за умови платної підписки: Gemini Advanced коштує 20 доларів США на місяць, а версія Enterprise - 30 доларів США.
Висновок: персоналізований ШІ для повсякденного життя і не тільки
Нові функції на платформі Gemini показують, як Google хоче зробити використання штучного інтелекту доступним для широкого кола користувачів. GEMS і Imagen 3 пропонують індивідуальну підтримку в широкому діапазоні сценаріїв і показують, що вже сьогодні можливо за допомогою штучного інтелекту. Google застосовує тут ретельний підхід, в якому інновації та відповідальність йдуть пліч-о-пліч. Такі заходи захисту, як SynthID, що розпізнає контент, створений штучним інтелектом, є особливо важливими.
Цими розробками Google демонструє, що майбутнє ШІ - за індивідуальними, відповідальними, але потужними рішеннями, які відповідають потребам користувачів і виходять за межі традиційних додатків. Окрім цих основних фактів, залишається цікавим побачити, які моделі є і будуть найбільш корисними в яких ситуаціях.