Szukam osoby do stworzenia dedykowanego systemu monitorującego ok. 50 stron internetowych operatorów funduszy/instytucji publicznych.
Wdrożenie systemu + miesięczny ryczałt za utrzymanie (naprawę adapterów).
Cel systemu: Automatyczne wykrywanie nowych naborów (aktualności) oraz weryfikacja list rankingowych (PDF/HTML) pod kątem konkretnych kandydatów.
Zakres prac (Core Features):
Monitoring (Etap 1): Cykliczne skanowanie ~50 URL (różne struktury DOM, brak standardu). Wykrycie nowego naboru -> Ekstrakcja danych kluczowych (Data, Budżet, Termin).
Weryfikacja (Etap 2): Po wykryciu naboru, system sprawdza listy rankingowe (często PDF lub tabele HTML), szukając konkretnych ID kandydatów.
Ze względu na różnorodność stron, myślałem użyć LLM do parsowania "brudnego" tekstu/HTML na ustrukturyzowany JSON (zamiast pisania 50 sztywnych reguł).
Backend: Zapis danych do bazy + powiadomienia E-mail.
Wymagania:
Doświadczenie z OCR (do odczytu skanów/PDF w Etapie 2).
Umiejętność obejścia podstawowych zabezpieczeń (choć strony urzędowe rzadko mają silne anty-boty).
Stała współpraca (Maintenance): Zdaje sobie sprawę, że strony operatorów zmieniają strukturę. Dlatego kluczowym elementem oferty jest obsługa miesięczna. Oczekuję szybkiej reakcji na błędy w skryptach (np. zmiana selektora na stronie X).
Wycena: Proszę o szacunkową wycenę w rozbiciu na:
Setup Fee (Wdrożenie): Stworzenie silnika, konfiguracja agentów dla ~50 stron.
Maintenance (Miesięcznie): Ryczałt za gotowość do naprawy błędów i drobne aktualizacje (np. do 5-10h pracy w miesiącu lub inna propozycja).
Zainteresowanych proszę o podanie przykładowych realizacji (scraping/automatyzacja) oraz preferowanego stacku technologicznego. Rozliczenie: Faktura B2B / Useme.
Korzystając z serwisu Zleca.pl wyrażasz zgodę na stosowanie plików cookies. Dowiedz się więcej.
X