O roli:
Hledáme vysoce motivovaného stážisty AI, který pomáhá při shromažďování a destilaci strukturovaných znalostí z učebnic fyziky a výzkumných materiálů pomocí velkých jazykových modelů (LLM). Budete spolupracovat s nejmodernějšími generativními nástroji AI, včetně OpenAI GPT-4O, Deepseek a Custom Python Pipelines pro extrakci, organizaci a zdokonalování vědeckého obsahu.
Tato stáž je ideální pro studenty nebo nedávné absolventy se zájmy o fyzice, strojovém učení a zpracování přirozeného jazyka (NLP). S pracovními postupy LLMS a rozvoje AI získáte praktické zkušenosti.
Požadavky:
- Silné programovací dovednosti v Pythonu, včetně knihoven.
- Základní porozumění tématům fyziky (střední škola až vysokoškolská úroveň).
- Poznání LLM a nástrojů, jako jsou API OpenAI, DeepSeek nebo objetí.
- Zkušenosti s rychlým inženýrstvím, předběžným zpracováním textu a anotací dat.
- Znalost dat hltací a práce s nestrukturovaným textem.
- Dobré dovednosti pro řešení problémů a schopnost pracovat samostatně a spolupracovat.
- Škrábnutí, čistě a strukturujte obsah z veřejně dostupných učebnic fyziky a vědeckých zdrojů.
- Vytvořte skripty Pythonu, aby předběžně zpracovali a segmentovali obsah do formátů připravených pro LLMS.
- Návrh a spusťte destilační potrubí k přeměně obsahu učebnic na stručná vysvětlení, páry otázek a odpovědí a souhrny konceptů.
- Využijte generativní modely (např. GPT-4o, Deepseek) pro shrnutí, generování otázek a konceptuální objasnění.
- Vyhodnoťte a iterujte na výstupy modelu pro jasnost, faktičnost a úplnost.
Možnost permenantské pozice po stáži.
Spravedlivá kompenzace.
Přihlaste se k odběru našeho zpravodaje a získejte doručené zprávy a nabídky.