Europharma Alliance Sp. z o.o.
Lokalizacja: Suchy Dwór k/Wrocławia lub HO
Zatrudnienie: B2B / UoP (część etatu - 20h/tyg.)
Doświadczenie: Mid
Dołącz do naszego Zespołu AI i zbuduj z nami firmowe repozytorium wiedzy.
Stworzyliśmy zespół AI, w skład którego wchodzą już doświadczony Mentor/Architekt oraz kreatywny Inżynier AI. Teraz szukamy trzeciej, kluczowej osoby, która pomoże nam w projekcie. Twoim głównym zadaniem będzie stworzenie i zarządzanie centralnym repozytorium wiedzy, które stanie się fundamentem dla naszych zaawansowanych automatyzacji opartych na AI (Claude, Gemini).
To nie jest standardowa praca programisty – to pozycja dla kogoś, kto chce specjalizować się w przygotowywaniu danych dla najnowszych systemów AI.
Co będziesz robić?
Twoim głównym celem będzie budowa i utrzymanie repozytorium wiedzy w PostgreSQL.
Inżynieria i Integracja Danych:
Projektowanie i implementacja potoków danych (ETL/ELT) do pobierania informacji z różnorodnych źródeł:
Poczta e-mail: Integracja z ok. 30 skrzynkami Microsoft 365 (przez Graph API).
Dokumenty: Przetwarzanie i ekstrakcja treści z setek dokumentów (PDF, Word, Excel).
Bazy danych: Pobieranie i synchronizacja danych z istniejących baz SQL (SQL Server).
Czyszczenie, strukturyzacja i przygotowywanie danych do dalszego wykorzystania przez modele AI.
Zapewnienie jakości i spójności danych w repozytorium.
Budowa Repozytorium Wiedzy dla AI:
Projektowanie i implementacja schematu bazy danych PostgreSQL zoptymalizowanej pod kątem wyszukiwania semantycznego.
Implementacja procesów chunkingu (dzielenia dokumentów na mniejsze fragmenty) i wektoryzacji danych.
Ścisła współpraca z Inżynierem AI w celu udostępniania danych jako kontekst dla zapytań do modeli językowych.
Wsparcie i Utrzymanie:
Monitorowanie procesów ETL i zapewnienie ich niezawodności.
Optymalizacja zapytań i wydajności bazy danych PostgreSQL.
Wspieranie zespołu w zakresie dostępu do danych i ich jakości.
Twój profil
Musisz mieć:
Python - solidne fundamenty i doświadczenie w przetwarzaniu danych (np. z użyciem biblioteki Pandas).
SQL i PostgreSQL - zaawansowane umiejętności, w tym projektowanie schematów, optymalizacja zapytań i zarządzanie bazą.
Doświadczenie w ETL / Inżynierii Danych - praktyczna umiejętność budowania procesów do ekstrakcji i transformacji danych.
Integracje API - podstawowe doświadczenie w pracy z API (REST, OAuth), szczególnie w kontekście pobierania danych.
Będzie dużym plusem:
Doświadczenie z Microsoft Graph API do integracji z Outlook/SharePoint.
Znajomość bibliotek do parsowania dokumentów (np. pypdf, python-docx).
Praktyczna znajomość Dockera do konteneryzacji skryptów.
Podstawowa wiedza na temat LLM i systemów RAG.
Doświadczenie z rozszerzeniem pgvector dla PostgreSQL.
Umiejętności miękkie:
Skrupulatność i dbałość o szczegóły - jakość danych jest kluczowa.
Umiejętność współpracy - będziesz blisko pracować z pozostałymi członkami zespołu AI.
Samodzielność w rozwiązywaniu problemów związanych z danymi.
Co oferujemy?
Opublikowana | 28 dni temu |
Wygasa | za 2 dni |
Rodzaj umowy | Praca stała, B2B |
Tryb pracy | Hybrydowa |
Źródło | ![]() |
Milczenie jest przytłaczające. Wysyłasz aplikacje jedna po drugiej, ale Twoja skrzynka odbiorcza pozostaje pusta. Nasze AI ujawnia ukryte bariery, które utrudniają Ci dotarcie do rekruterów.
Nie znaleziono ofert, spróbuj zmienić kryteria wyszukiwania.