12 вересня 2024 року компанія OpenAI здивувала технологічний світ випуском своїх новітніх моделей штучного інтелекту: o1 та o1-mini. Цей анонс знаменує собою значний крок у розвитку штучного інтелекту, особливо в галузі машинного мислення та вирішення проблем. Але що саме стоїть за цими новими моделями і як на них реагує технологічна спільнота?
Суть o1: Подумайте, перш ніж відповісти
OpenAI описує o1 як нову серію "моделей міркувань", призначених для вирішення складних завдань і вирішення більш складних проблем, ніж попередні моделі - особливо в галузі науки, програмування та математики.Основна ідея o1 полягає в тому, щоб дати моделі більше часу на "роздуми", перш ніж вона відповість. Це схоже на процес мислення людини, коли ми часто зупиняємося, щоб розглянути проблему з різних боків, перш ніж прийти до рішення.
"Ми навчили ці моделі витрачати більше часу на обдумування проблеми, перш ніж відповісти, як це робить людина". - Блог OpenAI
Технічні інновації та продуктивність
Моделі o1 використовують підхід, відомий як "ланцюжок думок". Модель проходить кілька внутрішніх етапів мислення, перш ніж генерує остаточну відповідь. Ці кроки невидимі користувачеві, але сприяють підвищенню якості та точності відповідіКілька вражаючих особливостей o1:
- На відбірковому іспиті до Міжнародної математичної олімпіади (ММО) o1 правильно розв'язав 83% завдань, порівняно з 13% на GPT-4o.
- У змаганнях Codeforces o1 досягла 89-го процентиля.
- OpenAI стверджує, що o1 працює так само, як і аспіранти у складних тестових завданнях з фізики, хімії та біології..
Перші реакції та відгуки
Перші реакції на o1 були неоднозначними, але переважно позитивними. Багато експертів вражені здатністю моделі вирішувати складні завдання, а Ітан Моллік, професор Уортонської школи, який тестував o1 протягом декількох тижнів, висловив свій ентузіазм:
"Коли ви знаходите завдання, які
Коли GPT-4o виходить з ладу, а o1 працює добре, o1 відчуває себе абсолютно чарівно".
Однак Джейсон Вей, дослідник OpenAI, який працював над o1, також наголошує на проблемі того, як зробити покращені можливості відчутними для кінцевих користувачів:
"Навіть для людини, яка працює в науці, нелегко знайти той діапазон підказок, де GPT-4o не спрацьовує, o1 працює добре, і я можу зарахувати відповідь".
o1 проти GPT-4o: зміна парадигми?
Особливість | o1 | GPT-4o |
---|---|---|
Фокус | Комплексне вирішення проблем | Широкі загальні знання |
Час реагування | Повільніше (більше часу на роздуми) | Швидше. |
Математика та кодування | Дуже сильний | Добре. |
Веб-пошук та обробка зображень | Немає в наявності | Доступно |
Безпека (тест на джейлбрейк) | 84/100 | 22/100 |
Незважаючи на вражаючу продуктивність o1, OpenAI підкреслює, що GPT-4o буде залишатися кращим вибором для багатьох повсякденних завдань. o1 наразі все ще не вистачає деяких важливих функцій, таких як веб-пошук, завантаження файлів або обробка зображень.Основна відмінність полягає в характері процесу мислення:
o1-mini: ефективна альтернатива
На додаток до o1, був також представлений o1-mini, менший і більш економічний варіант. o1-mini особливо ефективний для програмування і коштує на 80% дешевше, ніж o1.. Він ідеально підходить для додатків, які вимагають навичок міркування, але не потребують широких знань про світ.
Безпека та етичні міркування
OpenAI підкреслює, що з новими можливостями o1 посилюються заходи безпеки. Компанія розробила новий підхід до навчання з безпеки, який використовує міркування моделі, щоб краще пов'язати її з політиками безпеки та узгодженняУ тесті на "стійкість до втечі з в'язниці" - тобто здатність дотримуватися інструкцій з безпеки, навіть коли робляться спроби обходу - o1 набрав 84 бали зі 100 можливих, порівняно з 22 балами для GPT-4o..
Наявність та доступ
o1 і o1-mini тепер доступні для користувачів ChatGPT Plus і Team. Розробники з доступом до API також можуть використовувати моделі, хоча спочатку застосовуються обмеженняOpenAI планує зробити o1-mini доступним для безкоштовних користувачів ChatGPT в майбутньому, але поки що не назвав конкретних термінів..
Перспективи: Майбутнє машинного мислення
Поява o1 знаменує собою важливу віху в розвитку ШІ. Він показує, що ми переходимо від чистих мовних моделей до систем, які можуть імітувати складні процеси мислення. Джим Фан (Jim Fan), старший дослідник в NVIDIA, вважає o1 початком нової парадигми:
"Ми нарешті бачимо, як парадигма масштабування часу виведення популяризується і використовується у виробництві".
Найближчі тижні та місяці покажуть, як o1 працює на практиці та які нові можливості застосування він відкриває. Проте вже зараз зрозуміло одне: з o1 OpenAI вкотре підняв планку для систем штучного інтелекту і вступив на новий захоплюючий шлях у сфері машинного мислення.