Sobre o papel:
Estamos buscando um estagiário de IA altamente motivado para ajudar na coleta e destilação de conhecimentos estruturados de livros de física e materiais de pesquisa usando grandes modelos de idiomas (LLMS). Você trabalhará com ferramentas generativas de AI generativas de última geração, incluindo pipelines de Python OpenAI GPT-4O, Deepseek e Python para extrair, organizar e refinar o conteúdo científico.
Este estágio é ideal para estudantes ou recém -formados com interesses em física, aprendizado de máquina e processamento de linguagem natural (PNL). Você ganhará experiência prática com os fluxos de trabalho de desenvolvimento de LLMs e IA.
Requisitos:
- Fortes habilidades de programação em Python, incluindo bibliotecas.
- Compreensão básica dos tópicos de física (ensino médio a nível de graduação).
- Familiaridade com LLMs e ferramentas como API OpenAi, Deepseek ou Huggingface.
- Experiência com engenharia imediata, pré -processamento de texto e anotação de dados.
- Conhecimento de disputas de dados e trabalho com texto não estruturado.
- Boas habilidades de solução de problemas e a capacidade de trabalhar de forma independente e colaborativa.
- Raspe, limpe e estrutura conteúdo de livros de física publicamente disponíveis e recursos científicos.
- Crie scripts Python para pré-processamento e segmentar conteúdo em formatos prontos para LLMS.
- Projete e execute pipelines de destilação para converter conteúdo de livros didáticos em explicações concisas, pares de perguntas e respostas e resumos de conceito.
- Alavancar modelos generativos (por exemplo, GPT-4O, Deepseek) para resumo, geração de perguntas e esclarecimento conceitual.
- Avalie e iterar nas saídas do modelo para maior clareza, factualidade e integridade.
Possibilidade de posição permenant após o estágio.
Compensação justa.
Complicar UG (Haftungsbeschränkt)
Tal 44 - 80331 Munique, Alemanha
Inscreva -se em nossa newsletter para receber nossas notícias e ofertas a você.