Skip to content

HungarianNotation/TulaHack26

Repository files navigation

🛡️ АУДИОЩИТ | TulaHack 2026

Java TypeScript Python MySQL Docker

Кейс: Анонимизация голосовых данных
Команда: hot_code_band

АУДИОЩИТ — это B2B-сервис анонимизации аудиозаписей для защиты бизнеса от утечек информации и многомиллионных штрафов. Проект разработан в рамках хакатона TulaHack 2026.


💡 О продукте

Как работает наш «умный фильтр» (STT + LLM):

  1. Система автоматически находит персональные данные в речи.
  2. Заглушает (мьютит) их в самом аудиофайле.
  3. Полностью вырезает из текстовой расшифровки (транскрипции).
  4. Предоставляет удобный интерфейс с плеером, где визуально подсвечены удаленные фрагменты, и генерирует отчет по типам скрытых данных.

Что получает бизнес?

  • Соответствие 152-ФЗ: Легальное хранение и обработка очищенных данных (On-Premise для крупных банков или Облачное API для СМБ).
  • Безопасность: Снижение риска утечек ПДн до нуля.
  • Свобода данных: Очищенные звонки можно безопасно анализировать, улучшать скрипты продаж и обучать собственный ИИ.

🏗 Архитектура и Стек технологий

Проект имеет распределенную микросервисную архитектуру:

  • Backend API (/backend/demo): Java / Spring Boot. Отвечает за бизнес-логику, маршрутизацию файлов, управление доступом и связь с базой данных.
  • База данных: MySQL для хранения метаданных аудио, отчетов и пользователей.
  • ML / Audio Processing (/python-stt): Python. Микросервис, инкапсулирующий работу со Speech-to-Text (STT) моделями и LLM для распознавания и вырезания ПДн из аудио.
  • Frontend (/backendtest): TypeScript (Next.js/React). Пользовательский интерфейс с умным аудиоплеером и дашбордами.
  • Инфраструктура: Docker / Docker Compose, Nginx.

🚀 Запуск проекта (Docker Compose)

  1. Клонируйте репозиторий:
   git clone https://github.com/HungarianNotation/TulaHack26.git
   cd TulaHack26
  1. Настройка окружения Скопируйте пример конфигурации и заполните пароли/порты (включая доступы к MySQL):
cp exemple.env .env
  1. Права на файловую систему Для корректного сохранения аудиофайлов и их обработанных версий, выдайте права на директорию загрузок:
chmod -R 777 uploads/
  1. Запуск
docker-compose up --build -d
  1. Остановка и просмотр логов
docker-compose logs -f     # Просмотр логов в реальном времени
docker-compose down        # Остановка всех контейнеров

About

Репозиторий для разработки MVP в рамках XII межрегионального хакатона TulaHack–2026 (17–19 апреля 2026). Решение реальных кейсов от партнёров, 40-часовая сессия, итоговый прототип.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors