O roli:
Poszukujemy wysoce zmotywowanego stażystów AI, aby pomóc w gromadzeniu i destylacji wiedzy ustrukturyzowanej z podręczników fizyki i materiałów badawczych przy użyciu dużych modeli językowych (LLM). Będziesz pracował z najnowocześniejszymi generatywnymi narzędziami AI, w tym Openai GPT-4O, Deepseek i Custom Python Pipelines w celu wyodrębnienia, organizowania i udoskonalania treści naukowych.
Ten staż jest idealny dla studentów lub niedawnych absolwentów zainteresowanych fizyką, uczeniem maszynowym i przetwarzaniem języka naturalnego (NLP). Zdobędziesz praktyczne doświadczenie z przepływami pracy LLM i AI.
Wymagania:
- Silne umiejętności programowania w Python, w tym biblioteki.
- Podstawowe zrozumienie tematów fizyki (poziomy liceum do studiów licencjackich).
- Znajomość LLM i narzędzia, takie jak modele Openai API, Deepseek lub HuggingFace.
- Doświadczenie z szybką inżynierią, wstępnym przetwarzaniem tekstu i adnotacją danych.
- Wiedza na temat rozpowszechniania danych i pracy z nieustrukturyzowanym tekstem.
- Dobre umiejętności rozwiązywania problemów i zdolność do niezależnej pracy i współpracy.
- Zeskrob, czyść i struktury treść z publicznie dostępnych podręczników fizyki i zasobów naukowych.
- Zbuduj skrypty Python, aby przedstawić się i podzielić treść na szybkie formaty dla LLM.
- Projektuj i uruchom rurociągi destylacyjne, aby przekonwertować treść podręcznika na zwięzłe wyjaśnienia, pary pytań i odpowiedzi oraz podsumowania koncepcji.
- Wykorzystaj modele generatywne (np. GPT-4O, Deepseek) do podsumowania, generowania pytań i wyjaśnienia koncepcyjnego.
- Oceń i iteruj wyniki modelu pod kątem przejrzystości, faktyczności i kompletności.
Możliwość pozycji permennej po stażu.
Uczciwa odszkodowanie.
CompllyMarket UG (Haftungsbeschränkt)
Tal 44 - 80331 Monachium, Niemcy
Subskrybuj nasz biuletyn, aby dostarczyć nasze wiadomości i oferty.