Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Вложения и другие параметры
Вложения:
Перетащите файлы сюда или используйте кнопку для добавления файлов
Доступные типы файлов: doc, gif, jpg, mpg, pdf, png, txt, zip
Ограничения: максимум вложений в сообщении — 4 (4 осталось), максимальный размер всех файлов — 2 МБ, максимальный размер одного файла — 1 МБ
Обратите внимание: вложения не будут видны, пока модератор не одобрит их.
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор Vesle Anne
 - 16 декабря 2024, 14:09
@Utgarda Loki, нет, это не то. В той темке вы выяснили, что ллмки галлюцинируют. Это общеизвестная истина :) 
Тут как раз ничего нового.
Фишка этого исследования в том, что они создали ситуацию, когда ллмка говорила неправду "зная" что это неправда.
Смотрите скриншотик. Внутренний thinking process
20241216_120714.jpg
Автор Utgarda Loki
 - 16 декабря 2024, 14:02
Цитата: Vesle Anne от 15 декабря 2024, 00:49Весьма интересная статья о том, могут ли ллмки врать. Спойлер - могут :) Скриншоты просто обалденные.
https://arxiv.org/abs/2412.04984
Мы только что сами выяснили это в другой теме. :)
https://novalingua.net/index.php?topic=2362.msg169070#msg169070 (и с десяток сообщений далее, в частности, сообщение zwh через одно после того, на которое ссылка, где он поймал один ИИ соврамши).
Автор Vesle Anne
 - 15 декабря 2024, 00:49
Весьма интересная статья о том, могут ли ллмки врать. Спойлер - могут :) Скриншоты просто обалденные.
https://arxiv.org/abs/2412.04984
Автор Рокуэлл
 - 01 сентября 2024, 10:42
Цитата: Vesle Anne от 02 августа 2024, 14:11Ну вот, например, модели испытывают серьезные проблемы с пониманием спортивных видео (
(Блин, я подумал, что это модели на подиуме.)
Автор Vesle Anne
 - 01 сентября 2024, 01:00
Исследование появления социальных норма у ллм-агентов https://arxiv.org/abs/2408.12680
Автор Vesle Anne
 - 09 августа 2024, 13:18
Интересная штука, хоть и не про reasoning, но пусть будет, чтобы не потерялось: моделька, натасканная на самые популярные языки Африки: суахили, йоруба, кхоса, хауса, зулу + французский и английский
https://medium.com/@lelapa_ai/inkubalm-a-small-language-model-for-low-resource-african-languages-dc9793842dec

Сам по себе этот факт интересен. Африка - огромный континент с большим разнообразием языков, а основные игроки рынка в основном сосредоточены в Европе или США + Китай. Соответственно, про Африку как обычно все забывают (хотя чатджипити на базовом суахили болтает вполне прилично, но моих знаний языка не хватает, чтобы оценить его ответы по более серьезным вопросам).
Автор Vesle Anne
 - 07 августа 2024, 23:59
Интересный материал о том, объяснение собственных рассуждений моделью могут коррелировать с человеческими суждениями, они не полностью и не точно повторяют процесс принятия решения моделью, что указывает на разрыв между воспринимаемыми и реальными рассуждениями модели.
https://arxiv.org/abs/2407.14487
Автор Leo
 - 02 августа 2024, 16:23
Цитата: Poirot от 02 августа 2024, 16:09LLM это же вроде некий титул для юристов, получивших международную квалификацию. Хотя вроде там пишется LL.M.
master of laws, необязательно и международную
Автор Vesle Anne
 - 02 августа 2024, 16:11
 
Цитата: Poirot от 02 августа 2024, 16:09LLM это же вроде некий титул для юристов, получивших международную квалификацию.
;D возможно, не знала
Речь о large language models. Чатджипити и  ему подобная шушера
Автор Poirot
 - 02 августа 2024, 16:09
LLM это же вроде некий титул для юристов, получивших международную квалификацию. Хотя вроде там пишется LL.M.
Автор Vesle Anne
 - 02 августа 2024, 14:12
Решение ребусов ллмками
https://arxiv.org/abs/2408.00584
Автор Vesle Anne
 - 02 августа 2024, 14:11
Решила вынести в отдельную тему, так как тема богатая и интересная. И щас это прям hot topic.  Так что будет пополняться.

********

Ну вот, например, модели испытывают серьезные проблемы с пониманием спортивных видео (спорт - хороший образец для оценивания сложного структурированного поведения). 
https://arxiv.org/abs/2406.14877
Здесь попытка заставить модель объяснить свое собственное поведение
https://arxiv.org/html/2405.07436v1