OpenAI выпустила GPT-4.5 — обсуждение его возможностей, проблем и влияния на развитие AGI

OpenAI снова удивила — они представили GPT-4.5, и, кажется, это действительно серьезный шаг вперед. Вопрос в том, насколько он оправдает наши ожидания? Ведь каждый новый релиз сопровождается громкими заявлениями, но реальный опыт пользователей порой рисует иную картину.

Снижение галлюцинаций

Одна из самых обсуждаемых проблем языковых моделей — это галлюцинации. GPT-4.5, по заявлениям OpenAI, заметно улучшила свою точность. Если сравнивать с предыдущими версиями, то показатели впечатляют. В тесте PersonQA модель показала 78% правильных ответов, тогда как GPT-4o выдал корректные результаты лишь в 28% случаев. Это целых 50% разницы, что действительно внушает доверие.

Особенно важно уменьшение процента галлюцинаций до 19%. Это означает, что вероятность получения вымышленного ответа теперь значительно ниже. Но тут возникает вопрос: насколько это проявляется в повседневном использовании? Теоретические тесты — это одно, а реальный пользовательский опыт — совсем другое.

Понимание контекста

Одна из вещей, которая отличает GPT-4.5, — это его способность улавливать тонкие нюансы речи и реагировать на скрытые смысловые слои. Например, если раньше диалоги с ботом могли казаться формальными и вырванными из контекста, теперь модель должна отвечать более естественно.

Это особенно важно для задач, требующих не просто подбора фактов, а глубинного анализа смысла. Например, если ты спрашиваешь модель: «Стоит ли мне менять работу, если я чувствую выгорание?», GPT-4.5 сможет не только перечислить факторы, но и учесть эмоциональную составляющую вопроса, предложив более индивидуальный ответ.

Повышенная точность

Важным моментом стал рост точности ответов. В тесте SimpleQA новая версия набрала 62,5%, обогнав GPT-4o, у которого этот показатель оказался на уровне 38,6%. Это говорит о том, что GPT-4.5 не просто повторяет запомненные фразы, а действительно сопоставляет данные и делает более точные выводы.

Такая характеристика может быть полезна во многих сферах: от помощи в учебе до профессионального консалтинга. Например, если ты работаешь с анализом данных или юриспруденцией, точность информации играет ключевую роль. Ошибка в формулировке рекомендаций может стоить дорого, будь то правовые консультации или медицинские справки.

Эмоциональный интеллект

Еще одно интересное улучшение — улучшенное распознавание эмоций. Теперь GPT-4.5 лучше понимает подтекст и тональность вопроса. Например, если ты выражаешь обеспокоенность, модель может адаптировать ответ, чтобы он звучал более поддерживающе.

Это кажется небольшим изменением, но на самом деле оно играет огромную роль. Для тех случаев, когда тебе нужно не просто получить факты, а поговорить с кем-то «понимающим», такая способность модели может оказаться полезной. Это уже далеко не просто алгоритм, который выдает сухие факты, а что-то, больше напоминающее диалог с действительно внимательным собеседником.

При этом возникает вопрос: насколько далеко AI может зайти в этом направлении? Смогут ли следующие версии стать полноценными эмоциональными компаньонами или все же останутся просто инструментами?

ChatGPT - https://reszek.info/wp-content/uploads/2025/03/GPT-4.5-Improved-Accuracy-17-scaled

Технические детали

Теперь давай посмотрим, что скрывается под капотом у GPT-4.5. OpenAI не раскрывает точный размер модели, но по косвенным данным можно предположить, что она значительно превосходит предшественников. Судя по тестам, масштаб сопоставим с переходом от GPT-3.5 к GPT-4o. Это значит, что объем параметров и сложность архитектуры явно увеличились, что может объяснять улучшения в точности и понимании контекста.

Интересно, что новая модель использует комбинацию нескольких методов обучения, включая supervised fine-tuning (SFT) и обучение с подкреплением на основе обратной связи от людей (RLHF). Это позволяет ей лучше адаптироваться к реальным сценариям использования. Причем важным моментом становится внедрение методов «неконтролируемого обучения», что должно сделать модель еще более гибкой.

Стоимость и доступность

Вот тут начинается самое интересное. GPT-4.5 может показаться не самым доступным решением для массового использования. Ее стоимость составляет 75 долларов за миллион входных токенов и целых 150 долларов за миллион выходных. Это заметно дороже, чем у предыдущих версий.

Такой ценник делает модель скорее инструментом для бизнеса, чем для обычных пользователей. Особенно если учитывать растущий спрос на ИИ-решения, которые внедряются в SaaS-сервисы, аналитику и автоматизацию бизнес-процессов.

Ограничения

Несмотря на все улучшения, GPT-4.5 по-прежнему не идеальна. Например, модель может уступать более специализированным версиям, вроде o1 и o3-mini, в задачах, требующих сложного рассуждения. Это говорит о том, что, хотя новая модель демонстрирует прогресс, полного решения проблемы логического анализа пока нет.

Также на строгих научных тестах (MMLU) GPT-4.5 показала лишь незначительное улучшение. Это значит, что в академических и математических задачах модель всё ещё не идеальна. Хотя повседневные запросы она обрабатывает лучше, экспертным решениям она пока не может конкурировать с профессиональными инструментами.

Влияние на ИИ

Развитие таких моделей не проходит незамеченным. OpenAI отмечает, что GPT-4.5 — это последняя версия без механизма цепочки рассуждений. Это означает, что следующий шаг в развитии ИИ может стать еще более серьезным.

Более глубокое понимание контекста и снижение уровня галлюцинаций делают GPT-4.5 важной ступенью на пути к усовершенствованию языковых моделей. Но при этом нельзя сказать, что это тот самый прорыв, который перевернет всю индустрию. Скорее, это очередной шаг в эволюции, который приближает нас к созданию более мощных систем.

Будущее AGI

Может ли GPT-4.5 приблизить нас к созданию AGI? Скорее всего, нет. Но она точно закладывает основу для будущих моделей, которые смогут решать более сложные задачи, не ограничиваясь простым текстовым анализом.

Здесь встает ключевой вопрос: насколько быстро мы подходим к созданию действительно разумных систем? Пока что каждая новая версия демонстрирует прогресс, но не делает революции. Технологии идут вперед, но переход от специализированного ИИ к общему все еще остается сложной задачей.

В любом случае, с появлением GPT-4.5 становится ясно, что OpenAI продолжает развивать свои технологии. А это значит, что впереди нас ждет еще немало интересных обновлений.

ChatGPT - https://reszek.info/wp-content/uploads/2025/03/AI-Evolution-Progress-2-36-scaled