Новое

Evals: мегастатья для фаундера, чей AI-агент работает как попало

15:03 Habr.com

Через несколько дней будет 16 лет, как я на Хабре. Это моя первая статья.

Я делаю десктопный AI-ассистент для встреч. Агент суммаризирует транскрипты — и делал это плохо: галлюцинирует решения, теряет задачи, путает кто что сказал. Полгода я чинил промпты по ощущениям — менял слово, смотрел глазами на пару примеров, говорил «вроде лучше», деплоил. Это называется vibes-based development, и это тупик.

Потом я разобрался с evals — по сути, тестами для недетерминированных систем. Перелопатил Hamel Husain, Eugene Yan, гайды Anthropic, доку Mastra. Написал всё в одном месте: мегастатья от ручного разбора ошибок до self-improving loops, где агент улучшает себя сам за ночь. С кодом, граблями и метафорами про пиццу.

Другие новости

Сургутянам назвали предполагаемую дату ледохода на Оби

«Смоленскэнерго» установит более 55 птицезащитных устройств на линиях электропередачи в 2026 году

Оглоблина: инициатива создания экодеревень для ветеранов СВО требует проработки

Госвизит Ильхама Алиева в Тбилиси. Укрепление транзитного потенциала и экспорт «зеленой» энергии

Более 50 возгораний за неделю: как работники лесхозов борются с огнем

В США задумались о пересмотре законов из-за подорожания бензина

Глава Дагестана поручил проверить законность строек в поймах рек

В Прикамье ответят в суде «чёрные лесорубы», которые спилили более 600 деревьев на 28 миллионов рублей

Сыктывкарский ЛПК подвел итоги лесовосстановления в 2025 году

В Курской области почти два месяца будут проходить Дни защиты от экологической опасности

Медики в Дагестане вакцинируют население от гепатита А из-за наводнения

Карадагский заповедник дарит возможность красиво признаться в любви к Крыму

Меликов: многие из затопленных в Дагестане домов стоят прямо в русле реки

СК проверяет информацию о загрязнении реки под Тверью

В Кировской области готовятся к пожароопасному сезону

Путин поручил провести 7 апреля совещание в связи с наводнением в Дагестане

Рекультивация иловых полей в Казани выполнена на 93%

Минздрав: медики активно вакцинируют население в Дагестане от гепатита А

Жителей пострадавших от наводнения районов Дагестана вакцинируют от гепатита А

Интерактивную карту электрозаправок разработали в Крыму

В апреле масштабные лесные пожары Марий Эл не грозят

Более 100 пассажиров поездов эвакуируют в Дагестане из-за наводнения

Считаете свой регион самым чистым и экологически безопасным? Тогда голосуйте за него в онлайн-опросе

Мусорному регоператору «Экотехнологии» грозит расторжение контракта в Воронежской области

Путин поручил оказать помощь пострадавшим от наводнения в Дагестане

Путин поручил помочь пострадавшим из-за наводнения жителям Дагестана

«Сообщения бодряка не дают»: Бородина не сразу заметила наводнение в Дагестане

Разгоняли облака над Ираном. США приложили руку к наводнениям в Дагестане?

В Ростовской области депутат заявил об «узаконенном браконьерстве» в Таганрогском заливе

Более 3-х миллионов рублей для защиты от наводнения

«Мы опять утонули»: жительница Махачкалы рассказала о последствиях наводнения

«Мы опять утонули»: жительница Махачкалы рассказала последствиях наводнения

Из-за наводнения в Дагестане погибли беременная женщина и ребенок

Срыв краснокнижных тюльпанов в степях Калмыкии грозит крупным штрафом

Погибшие, разрушения и эвакуация: последствия наводнения в Дагестане

В Дагестане нашли мертвой 5-летнюю девочку, которую унесло течением

2 человека погибли, подтоплены 4 микрорайона в результате наводнения в Дагестане

459 населенных пунктов оказались под угрозой лесных пожаров в Тульской области

В Ярославской области введут штрафы за сбор краснокнижных грибов

Уровень воды в реке Вятка составил 151 см от нулевого поста

В заказнике «Раковые озера» стартовали весенние субботники 2026 года

Другие новости сегодня