陈旭天

chenxutian@buaa.edu.cn github.com/Blossom0913 blossom0913.github.io 17369720372

教育经历

北京航空航天大学 | 2025/9 – 至今 人工智能硕士 | 北京,中国

  • 主要课程:强化学习、深度学习、多模态大模型导论等

暨南大学 | 2021/9 – 2025/7 人工智能学士 | 珠海,中国

  • 主要课程:自然语言处理、机器学习、人工智能原理等

实习经历

美团 无人车业务部 | 2026/3 – 2026/10 决策规划算法实习生 | 北京,中国

  • rule-based规则设计,改进路口出边轨迹可行性判断函数
  • 搭建数据pipeline,使用Jenkins工作流,搭建每日定量专家数据闭环
  • TBD

项目经历

Tiny-llm | 2026/04 – 2026/6

PlayTask | github.com/Blossom0913/PlayTask

  • 独立设计并开发的时间管理 APP,完成完整的 Android Studio 开发流程与 UI/UX 设计
  • 技术栈:Android, Kotlin, Java

竞赛经历

ASC2022 | 2021/11 – 2022/6 团队成员 | 珠海,中国

  • 项目目标:在有限算力(8× Tesla V100 16GB)和功耗约束下,完成 47 亿参数”源1.0”大语言模型的预训练,并实现 55% 的训练加速(从 45h 降至 28h)。
  • 内存优化:主导应用 ZeRO-Offload 与 ZeRO Stage 1 技术,成功将 75.2GB 的模型状态(参数、梯度、优化器状态)卸载至CPU内存,在仅 8×16GB 显存上跑通 47 亿参数模型,解决了 CUDA OOM 瓶颈。
  • 训练加速:部署 Megatron-DeepSpeed 框架,设计并实施 4路张量并行 + 2路流水线并行 的策略,相较单纯8路张量并行,将训练吞吐从 4.08 samples/s 提升至 4.66 samples/s。引入混合精度训练 (AMP),在 NVIDIA Tensor Core 上利用 FP16 算术加速计算,并解决精度溢出问题。用 Intel MKL 数学库编译 PyTorch,并将其与针对CPU卸载优化的 DeepSpeed CPU Adam 优化器结合,显著加速了 CPU 端的优化器计算步骤。

科研经历

广东省智能科学与技术研究院 | 2025/2 – 2025/9 算法实习生 | 珠海,中国

多智能体路径规划 | 2024/3 – 2024/7 研究助理 | 珠海,中国

  • 构建 AGV 平台与本地服务器的消息交互架构,在真实业务约束下保持车队状态同步。
  • 复现浙江大学 APRIL 实验室的 CL-CBS 多智能体路径规划算法基线,并改进后应用于仿真 AGV 平台。论文:CL-MAPF:具有运动学与时空约束的类车机器人多智能体路径规划
  • 与团队调研并分析 CL-CBS 在真实业务场景的可行性,修复缺陷并提出较原始算法(如 Hybrid A*)更快的策略,周期约 3 个月。

技能

编程语言: Python, C/C++, Java, Rust, Kotlin

技术技能: PyTorch, TensorFlow, DeepSpeed, Megatron, CUDA, Git, SSH, Linux

核心能力: 分布式训练,混合精度训练,大模型内存优化,模型推理与部署