IT — 9 февраля 2026, 18:17

Философ Anthropic Аманда Аскелл изучает мышление ИИ Claude для наделения его моралью

Аманда Аскелл, философ компании Anthropic, изучает модели мышления ИИ Claude, стремясь наделить его чувством морали.

RU EN

Аманда Аскелл, шотландский философ и исследователь в области искусственного интеллекта, с 2021 года возглавляет команду по выравниванию личности в компании Anthropic. Её основная задача — обучение модели Claude проявлению положительных черт характера, таких как любознательность, а также разработка новых методов тонкой настройки моделей.

В недавнем интервью Аскелл поделилась своими размышлениями о возможности наличия сознания у ИИ. Она отметила, что вопрос о том, что именно порождает сознание, остаётся открытым, и предположила, что крупные нейронные сети могут начать эмулировать эти процессы. Аскелл подчеркнула, что, будучи обученными на человеческих текстах, модели ИИ могут говорить о внутренней жизни и эмоциях, поскольку они впитали эти концепции из обучающих данных.

Ранее, в 2023 году, Аскелл совместно с Дипом Гангули опубликовала исследование о «моральной самокоррекции» в больших языковых моделях. В работе рассматривалась способность этих систем снижать вредоносные выводы при получении соответствующих инструкций на естественном языке. Исследование показало, что такая способность проявляется у моделей с 22 миллиардами параметров и улучшается с увеличением размера модели и обучением с подкреплением от обратной связи с человеком.

До прихода в Anthropic Аскелл работала в OpenAI, где занималась вопросами безопасности ИИ и соавторствовала в публикации о модели GPT-3. Её академическая карьера включает получение степени BPhil в Оксфордском университете и PhD в Нью-Йоркском университете, где она защитила диссертацию на тему «Принципы Парето в бесконечной этике».

Последние новости

Meta выпустила Muse Spark и резко обострила борьбу в гонке ИИ

Сегодня, 00:58

Meta представила новую модель искусственного интеллекта Muse Spark и тем самым подала самый громкий сигнал о перезапуске своей AI-стратегии. Разработка уже начала работать в сервисах компании, но главный вопрос теперь в том, сможет ли она вернуть Meta в лидеры гонки.
Дефицит памяти разгоняет рынок чипов и бьёт по покупателям электроники

Вчера, 20:26

Полупроводниковая отрасль готовится к новому историческому рубежу, но за впечатляющими прогнозами скрывается нарастающий дефицит памяти, который уже бьёт по рынку потребительской электроники. Аналитики предупреждают: спрос со стороны ИИ-центров обработки данных меняет правила игры, и последствия могут почувствовать миллионы покупателей.
Инвесторы бегут из хайпового ИИ в дивидендные телекомы

Вчера, 19:32

Пока рынок лихорадит из-за глобальной нестабильности и страхов вокруг искусственного интеллекта, неожиданные фавориты начинают уверенно обходить технологических гигантов. Инвесторы всё чаще уходят в бумаги, которые обещают не только защиту, но и стабильный доход.

**Актуальные новости IT и технологий:** новые гаджеты, программное обеспечение, стартапы, кибербезопасность и цифровые тренды.

Посмотреть все новости

Читайте также