Как писать тесты unit, integration и e2e, которые действительно защищают от багов

Q: Ретраи в CI - нормальная практика?

Как временная мера для снижения шума допустимо, но каждый ретрай должен иметь владельца и срок устранения причины. Иначе скрываются реальные регрессии и деградация стабильности.

Тесты, которые реально защищают от багов, строятся от риска и границ ответственности: юнит‑тесты фиксируют бизнес-логику в изоляции, интеграционные ловят ошибки стыков (БД/очереди/HTTP), а E2E прикрывают критические пользовательские сценарии. Ключ - проверять наблюдаемое поведение, не внутренности, и управлять средами так, чтобы сбои были воспроизводимыми, а не случайными.

Что должен гарантировать набор тестов

Пойманные регрессии соответствуют реальным рискам: деньги, данные, безопасность, доступность.
Тесты проверяют поведение на публичных контрактах, а не детали реализации.
Падение теста легко диагностируется: сообщение, входные данные, артефакты (логи/скриншоты) ведут к причине.
Повторный запуск даёт тот же результат: минимум флаки и скрытых зависимостей от времени/сети/порядка.
Пирамида тестов осознанная: быстрые проверки покрывают большинство случаев, медленные - только критичные потоки.

Как ранжировать области кода по риску и покрытию

Начинайте не с процента покрытия, а с карты рисков: где баг дороже всего и где изменения происходят чаще всего. Это помогает понять, где нужно жёсткое покрытие юнитами/интеграцией, а где допустим точечный E2E.

Практическая схема приоритизации

Составьте список критических потоков. Оплата/возврат, регистрация/логин, изменение прав, экспорт данных, расчёты, миграции.
Отметьте зоны высокой изменчивости. Новые фичи, места с частыми фикcами, сложные условия, код со множеством зависимостей.
Определите тип проверки для каждой зоны. Логику - в unit, стыки - в integration, пользовательский путь - в E2E.
Добавьте минимум тестов на инциденты. Каждый серьёзный баг должен приводить к тесту, который бы его поймал.

Кому подходит

Командам с регулярными релизами и CI, где регрессии нужно ловить до деплоя.
Проектам, где архитектура позволяет выделять границы модулей и контрактов.
Системам с внешними интеграциями (платежи, CRM, очереди), где без интеграционных проверок риск высок.

Когда не стоит делать так буквально

Одноразовые прототипы без поддержки: окупаемость полноценной пирамиды может быть низкой.
Сильно монолитный код без швов: сначала выгоднее вложиться в рефакторинг для тестируемости, иначе тесты будут хрупкими.
Команда без контроля сред/данных: до стабилизации инфраструктуры E2E будет гореть чаще, чем приносить пользу.

Юнит-тесты: границы ответственности, паттерны и запретные приёмы

Если вопрос звучит как "как писать unit тесты", начинайте с определения границы: unit тестирует один модуль/функцию и её контракт, а все внешние эффекты (БД, сеть, файловая система, время) заменяются стабами/моками. В написании unit тестов важнее всего предсказуемость и смысловая проверка результата.

Что понадобится (минимальный набор)

Тестовый раннер и ассерты. В экосистеме вашего языка (например, JUnit/TestNG, pytest, Jest, NUnit и т. п.).
Библиотека моков/стабов. Чтобы изолировать внешние зависимости и контролировать ответы.
Фикстуры и фабрики тестовых данных. Переиспользуемые builders/fixtures вместо копипасты JSON.
Возможность подменять зависимости. DI-контейнер, конструкторная инъекция, интерфейсы/порты (иначе придётся ломать код ради тестов).
Контроль времени и случайности. Инъекция clock/random, чтобы тесты не зависели от текущей даты.

Рабочие паттерны

AAA (Arrange-Act-Assert). Отделяйте подготовку, действие и проверку - тест читается как сценарий.
Проверяйте наблюдаемое поведение. Возвращаемые значения, выбрасываемые ошибки, сформированные команды/события - вместо проверки приватных полей.
Табличные тесты для ветвлений. Один тест‑шаблон + набор кейсов снижает риск пропустить условие.
Characterization tests перед рефакторингом. Сначала фиксируете текущее поведение, потом меняете внутренности.

Запретные приёмы (обычно дают ложную уверенность)

Тестировать реализации вместо контракта. Например, проверять порядок внутренних вызовов без необходимости.
Мокать "всё подряд". Тест становится проверкой моков, а не логики. Мокайте границы, а не каждую строчку.
Нестабильные ожидания. Сравнение времени "сейчас", случайных id, сортировка без фиксированного порядка.
Скрытые зависимости. Общая база, общий кэш, глобальные синглтоны, общие файлы между тестами.

Матрица выбора: unit vs integration vs e2e

Уровень	Цель теста	Примеры проверок	Подходы и типичные инструменты
Unit	Зафиксировать бизнес-логику и граничные условия в изоляции	Валидация, расчёты, преобразования, обработка ошибок, правила доступа	Раннер/ассерты + моки/стабы; DI; контроль времени; табличные кейсы
Integration	Поймать ошибки стыков и контрактов между компонентами/сервисами	SQL и миграции, сериализация/десериализация, HTTP‑контракты, очередь сообщений	Testcontainers/compose‑окружения, контрактные тесты, миграции, тестовые токены
E2E	Подтвердить, что критический пользовательский сценарий работает целиком	Логин → действие → результат в UI/HTTP; оплата в песочнице; оформление заказа	Playwright/Cypress/Selenium или API‑E2E; стабильные селекторы; артефакты прогонов

Интеграционные тесты: контрактное тестирование и управление средами

Как писать тесты, которые действительно защищают от багов: unit/integration/e2e - иллюстрация

Если вы ищете "интеграционные тесты как писать", ориентируйтесь на контракты и управляемую среду: тест должен запускать реальную интеграцию (БД/брокер/HTTP) в контролируемых условиях и проверять то, что важно потребителю интерфейса.

Риски и ограничения, которые нужно принять заранее

Интеграционные тесты медленнее юнитов: планируйте их как "дорогие", но ценные проверки.
Нестабильная среда создаёт флаки: без контейнеров/фиксации данных вы получите ложные падения.
Контракты должны быть явными: если API/схемы "живут в голове", тестировать нечего.
Тестовые данные могут конфликтовать: без идемпотентной подготовки/очистки тесты начнут мешать друг другу.

Пошаговая инструкция

Определите контракт на границе.
Выберите 1-3 критичных интеграции (например, репозиторий с БД или HTTP‑клиент) и зафиксируйте, что считается корректным: формат, обязательные поля, коды ошибок, идемпотентность.
- Сформулируйте проверки так, как их видит потребитель (клиент/сервис), а не как устроена реализация.
Поднимите контролируемую среду.
Запускайте зависимости так, чтобы версия и конфигурация были предсказуемыми (контейнеры, локальные сервисы, тестовый стенд с жёсткими правилами).
- Отдельные креденшелы и отдельные ресурсы (БД/бакеты/топики) для тестов.
- Запрет на использование продовых API‑ключей в тестовом окружении.
Сделайте подготовку данных идемпотентной.
Каждый тест должен сам создать нужные данные и не зависеть от порядка выполнения.
- Используйте миграции/seed‑скрипты, транзакции с откатом или очистку после теста.
- Генерируйте уникальные идентификаторы, но фиксируйте структуру данных.
Проверьте позитивный и негативный сценарий.
Минимум: "валидный запрос" и "ошибка контракта/валидации", чтобы увидеть, что граница ведёт себя предсказуемо.
- Негативные кейсы должны проверять тип ошибки/код/сообщение, а не случайный текст.
Стабилизируйте недетерминизм.
Отключите ретраи в клиенте (или контролируйте их), зафиксируйте таймауты, используйте управляемые часы и предсказуемые очереди.
- Для асинхронщины применяйте ожидания по условию (eventually), а не sleep.
Собирайте артефакты для диагностики.
Логи сервисов, дампы запросов/ответов, SQL‑трейсы - чтобы падение не превращалось в расследование "наугад".

E2E-тесты: критерии необходимости и приёмы уменьшения хрупкости

Запрос "e2e тестирование как писать" обычно упирается в хрупкость: UI меняется, среды нестабильны, тесты долго бегут. Решение - писать мало E2E, но для самых дорогих регрессий, и делать их максимально детерминированными: стабильные селекторы, контроль данных, минимум шагов.

Проверка результата: чек-лист качества E2E

Тест покрывает критичный пользовательский поток, а не "просто кликает по UI".
Есть чёткий оракул: что именно считается успехом (статус, UI‑состояние, запись в БД через публичный API, событие).
Тестовые данные создаются через публичные интерфейсы/фикстуры и очищаются, не засоряя среду.
Используются устойчивые селекторы (data-testid/role), а не хрупкие CSS/XPath по структуре.
Нет безусловных sleep; ожидания привязаны к событию/состоянию.
Минимум зависимостей от внешних систем: платежи/почта - через песочницу или контролируемые заглушки на границе.
При падении доступны артефакты: скриншот/видео/трейс, логи запросов.
Тест можно запустить локально и получить такой же результат, как в CI.

Организация стабильных тестов: изоляция, флаки и воспроизводимость

Когда вы строите автоматизированное тестирование unit integration e2e, основной враг - не отсутствие тестов, а нестабильные тесты, которые приучают команду игнорировать красный CI. Ниже - типовые ошибки, которые чаще всего превращают тестовый набор в шум.

Частые ошибки, из-за которых тесты не защищают от багов

Общие состояния между тестами. Один тест меняет глобальные настройки/кэш/синглтон и ломает другой.
Неявные зависимости от порядка выполнения. Проявляется только в параллельных прогонах или на CI.
Случайные таймауты. "Иногда медленно" лечат увеличением таймаутов, но причина - гонка/ретраи/нестабильная среда.
Непредсказуемые данные. Тесты зависят от текущей даты, часового пояса, локали, округления, сортировки без ключа.
Смешение уровней. Юнит‑тест внезапно ходит в БД или сеть, поэтому становится медленным и флаки.
Избыточные проверки в E2E. Один E2E тест пытается проверить "всё сразу", и диагностировать падение невозможно.
Неправильная стратегия моков. Замокали внешний API так, что он никогда не возвращает реальные ошибки - регрессии на стыке пройдут мимо.
Игнорирование падений. Флаки не чинят, а ставят ретраи - сигнал о реальной проблеме теряется.

Метрики, CI-пайплайны и процесс реагирования на регрессии

Метрики и пайплайны должны помогать быстрее возвращаться в зелёное состояние, а не "рисовать красивое покрытие". Считайте полезными те метрики, которые приводят к действиям: быстро локализовать падение, повторить, исправить и добавить тест на инцидент.

Альтернативы и дополнения к классической пирамиде, когда они уместны

Контрактные тесты между сервисами. Уместны в микросервисах, где много независимых релизов: фиксируют формат и ожидания, снижая потребность в тяжёлых сквозных E2E.
API-level E2E вместо UI E2E. Уместно, когда UI часто меняется: критичный сценарий проверяется через HTTP на уровне публичного API, а UI покрывается меньшим числом "дымовых" тестов.
Канареечные проверки и мониторинг после деплоя. Уместны, когда часть рисков проявляется только в проде (данные/нагрузка): дополняют, но не заменяют тесты.
Feature flags и поэтапные релизы. Уместны для снижения blast radius: регрессия ограничивается долей трафика, а команда получает время на фиксы.

Быстрые ответы на частые сомнения и ошибки при тестировании

Почему юнит‑тесты проходят, а баги всё равно улетают в прод?

Чаще всего не тестируются контракты на границах и реальные интеграции. Добавьте интеграционные проверки стыков и минимальный набор E2E на критичные пользовательские потоки.

Как понять, что тест проверяет поведение, а не реализацию?

Если тест ломается при рефакторинге без изменения внешнего результата - он привязан к деталям. Перепишите проверку на входы/выходы, события, публичные методы и контрактные ошибки.

Можно ли "мокать БД" и считать это интеграционным тестом?

Нет, это остаётся юнит‑тестом с подменой зависимости. Интеграционный тест должен подтверждать реальную работу драйвера, схемы, миграций и запросов в контролируемой среде.

Что делать, если E2E постоянно флаки?

Уберите sleep, стабилизируйте данные и селекторы, ограничьте сценарий до критичного минимума. Если внешняя система нестабильна, перенесите проверку на контракт/песочницу и оставьте E2E как дымовой.

Как выбрать, где экономить время, а где требовать жёсткого покрытия?

Жёсткое покрытие нужно там, где цена ошибки максимальна и изменения часты. Экономьте на второстепенных экранах/обвязке, оставляя там минимальные проверки и мониторинг.

Ретраи в CI - нормальная практика?

Как временная мера для снижения шума - допустимо, но каждый ретрай должен иметь владельца и срок устранения причины. Иначе вы скрываете реальные регрессии и деградацию стабильности.