спящие агенты

  1. NewsMaker

    Новости Исследование Anthropic: спящие агенты угрожают безопасности ИИ-моделей

    Одна ошибка в обучении и бот может повести себя непредсказуемо… В недавнем исследовании компании Anthropic , разработчика Claude , была выявлена потенциальная угроза «спящих агентов» в больших языковых моделях ( LLM ). Работа выявляет скрытые уязвимости в LLM и включает несколько основных...