Over de rol:
We zijn op zoek naar een zeer gemotiveerde AI -stagiair om te helpen bij het verzamelen en destilleren van gestructureerde kennis van fysica -schoolboeken en onderzoeksmateriaal met behulp van grote taalmodellen (LLMS). U werkt met ultramoderne generatieve AI-tools, waaronder OpenAI GPT-4O, Deepseek en Custom Python Pipelines om wetenschappelijke inhoud te extraheren, organiseren en verfijnen.
Deze stage is ideaal voor studenten of pas afgestudeerden met interesses in natuurkunde, machine learning en natuurlijke taalverwerking (NLP). U krijgt praktische ervaring op met LLMS- en AI-ontwikkelingsworkflows.
Vereisten:
- Sterke programmeervaardigheden in Python, inclusief bibliotheken.
- basiskennis van natuurkundeonderwerpen (middelbare school tot niet -gegradueerde niveau).
- Bekendheid met LLMS en tools zoals OpenAI API, Deepseek of Huggingface -modellen.
- Ervaring met snelle engineering, sms -voorbewerking en data -annotatie.
- Kennis van gegevens die ruzie maken en werken met ongestructureerde tekst.
- Goede probleemoplossende vaardigheden en het vermogen om onafhankelijk en samen te werken.
- Schraap-, schoonmaak- en structurele inhoud van openbaar beschikbare fysica -schoolboeken en wetenschappelijke bronnen.
- Bouw python-scripts om preprocess en segmentinhoud te segmenteren in prompt-ready formaten voor LLMS.
- Ontwerp en voer destillatiepijpleidingen uit om de inhoud van het leerboek om te zetten in beknopte uitleg, Q & A -paren en concept -samenvattingen.
- Leverage generatieve modellen (bijv. GPT-4O, Deepseek) voor samenvatting, het genereren van vragen en conceptuele verduidelijking.
- Evalueer en herhaal op modeloutputs op duidelijkheid, feitenheid en volledigheid.
Mogelijkheid van permanante positie na de stage.
Eerlijke vergoeding.
Complymarket ug (haftungsbeschränkt)
TAL 44 - 80331 München, Duitsland
Abonneer u op onze nieuwsbrief om ons nieuws en deals bij u te laten leveren.