关于角色:
我们正在寻求一个高度动机的AI实习生,以帮助使用大语言模型(LLM)从物理教科书和研究材料中收集和提炼结构化知识。 您将使用最先进的生成AI工具,包括OpenAI GPT-4O,DeepSeek和Custom Python Pipelines,以提取,组织和完善科学内容。
这项实习是对物理学,机器学习和自然语言处理(NLP)感兴趣的学生或最近毕业生的理想选择。 您将获得LLM和AI开发工作流程的实践经验。
要求:
- Python的强大编程技能,包括图书馆。
- 对物理主题的基本理解(高中至本科水平)。
- 熟悉LLM和工具,例如OpenAI API,DeepSeek或HuggingFace模型。
- 具有及时工程,文本预处理和数据注释的经验。
- 了解数据争吵和使用非结构化文本的知识。
- 良好的解决问题的技能以及独立和协作工作的能力。
- 刮擦,清洁和结构公开可用的物理教科书和科学资源的内容。
- 构建Python脚本以预处理和细分内容为LLMS的及时准备格式。
- 设计和运行蒸馏管道将教科书内容转换为简洁的说明,问答对以及概念摘要。
- 利用生成模型(例如GPT-4O,DeepSeek)进行总结,问题产生和概念澄清。
- 评估并迭代模型输出,以清晰,事实和完整性。
实习后有可能获得允许的位置。
公平的补偿。
订阅我们的新闻通讯,以使我们的新闻和交易交付给您.