Как мы собираем, обрабатываем и публикуем материалы на Тотал.
Источники контента
Тотал работает как агрегатор новостей Казахстана. Мы обрабатываем материалы из казахстанских СМИ и информационных агентств. Каждая агрегированная статья содержит ссылку на первоисточник в поле «Источник».
AI-обогащение
Мы используем искусственный интеллект для извлечения метаданных из текста: ключевые сущности (люди, организации, локации), тематические теги, краткая суммаризация. Это позволяет строить семантический граф публикаций и находить связи между материалами.
- NER — распознавание именованных сущностей (модель DeepSeek v3)
- Суммаризация — генерация кратких резюме
- Тегирование — автоматическое извлечение тематик
- Сентимент-анализ — BERT, оценка эмоциональной окраски
- Семантический поиск — векторные эмбеддинги (Qdrant + MeiliSearch)
AI не переписывает и не генерирует новый текст. Обогащение — это только добавление структурированных данных поверх оригинального материала.
Маркировка материалов
В соответствии с Законом РК об искусственном интеллекте, подписанным 17 ноября 2025 года и вступившим в силу 18 января 2026 года, каждый материал имеет маркировку о типе AI-обработки:
- «Материал обработан с использованием ИИ» — применено обогащение метаданными
- «Без обработки ИИ» — исходный вид, маркировка в интерфейсе скрыта
Для оригинальных материалов дополнительно указывается тип контента: «Оригинал», «Перевод», «AI-контент», «Мнение», «Спонсорский».
Редакторский контроль
Агрегированный контент проходит автоматический quality gate: проверка наличия изображений, тегов, минимальной длины. Статьи из доверенных источников публикуются автоматически. Остальные попадают в очередь на модерацию редактора.
Открытые данные
Мы публикуем агрегированную статистику и визуализации в разделе Тотал.Данные. Исходные данные доступны через API по запросу.
Контакты
Вопросы по методологии: editor@total.kz