mono — мультипродуктова компанія з України. Із 2017 року мільйони людей муркочуть від наших продуктів: monobank, Expirenza, Base, monoбізнес, monoмаркет... Прагнемо створити ще більше для нашої екосистеми!
Ми шукаємо LLM Research Engineer, який_а допоможе нам створювати власні великі мовні моделі — з нуля і під потреби наших продуктів.
Ти працюватимеш із сучасними технологіями, експериментуватимеш із архітектурами та допомагатимеш перетворювати AI-ідеї на реальні рішення.
Знайомся детальніше з вакансією, відгукуйся, якщо твоє/про тебе, ми вже ловимо звісточку 🐾
Нумо втілювати амбітні ідеї разом!
1. Deep Learning & NLP
— Досвід навчання трансформерів з нуля (GPT-like, decoder-only).
— Розуміння архітектур: attention mechanism, causal masking, positional encoding.
— Self-supervised learning: next token prediction, masked language modeling.
— Fine-tuning методи: LoRA, QLoRA, adapter tuning.
— Знання принципів NLP-токенізації: BPE, WordPiece, SentencePiece.
2. ML Frameworks
— Впевнене володіння PyTorch (training loops, custom models, optimization)
— Досвід роботи з HuggingFace Transformers/Tokenizers.
— Розуміння підходів до ефективного навчання (FlashAttention або аналоги).
— Досвід mixed precision training (BF16/FP16).
— Оптимізація через torch.compile, CUDA.
3. Distributed Training
— Практичний досвід із DDP (Distributed Data Parallel), FSDP (Fully Sharded Data Parallel).
— Використання Ray або аналогів для паралелізації.
— Навчання моделей у multi-GPU середовищі, gradient accumulation.
4. Data Engineering
— Впевнене володіння SQL (складні запити, оптимізація, temporal splits).
— Робота з великими даними: Pandas, PyArrow, Parquet.
— Побудова ETL-пайплайнів для мільйонів записів.
— Знання memory-mapped files, ефективне завантаження даних.
5. LLM Applications & Agent Systems
— Досвід з LangChain / LangGraph (orchestration, chains, agents).
— Розуміння агентних систем: ReAct, tool use, function calling.
— Знання патернів RAG (Retrieval-Augmented Generation).
— Навички prompt engineering і створення структурованих виходів.
— Моніторинг і спостережуваність LLM (observability & monitoring).
6. Python & Software Engineering
— Чистий, структурований код із typing і документацією.
— Розуміння алгоритмів і структур даних (пошук, сортування, графи, дерева, хеш-таблиці).
— Знання складності алгоритмів (Big O) та оптимізація bottlenecks.
— Принципи ООП: SOLID, композиція проти наслідування.
— Досвід із багатопоточністю та асинхронністю (threading, multiprocessing, asyncio).
— Практика роботи з Git, code review, CI/CD.
— Debugging і профілювання (memory/GPU usage, cProfile, py-spy).
— Тестування: unit tests, integration tests (pytest).
— Розробляти та навчати
— Експериментувати з архітектурами, токенізацією, гіперпараметрами та методами fine-tuning (LoRA, QLoRA, adapters).
— Оптимізувати навчання та інференс у multi-GPU та distributed середовищі (PyTorch, HuggingFace, FSDP, mixed precision).
— Створювати та підтримувати ETL-пайплайни для обробки великих датасетів (SQL, Parquet, Pandas/PyArrow).
— Інтегрувати моделі у
— Писати чистий, тестований Python-код, оптимізувати продуктивність і брати участь у проєктуванні архітектури рішень.
— Співпрацювати з командами розробки та аналітики, презентувати результати експериментів і пропонувати покращення.
— Гідна винагорода та її регулярний перегляд за результатами
— Гнучкий графік роботи без трекерів і параної
— Можливість гібридної роботи чи повністю віддалено
— Відпустка 18 робочих днів на рік + 2 дні для форс-мажорів + 6 днів для навчання
— Оплачувані дей-офи за станом здоров’я — без SMS і лікарняних листів
— Корпоративні курси інглішу
— 100% страхування здоров’я + підтримка менталочки
— Картка Platinum від monobank і пундики від наших партнерів
🇺🇦 Підтримуємо сили оборони України власними зборами, розвиваємо культуру донатерства