職位描述

工作職責
-預訓練和微調大語言模型,基于自有數據,訓練更適合需求場景的大語言模型
-與數據工程師合作,理解和預處理數據,以準備用于深度學習模型的輸入
-閱讀和理解最新的研究論文,跟蹤和使用業界最佳實踐進行模型訓練,驗證并分析效果和
-監控模型訓練過程,進行問題排查和調優
任職資格
-計算機科學,電子工程,數學,物理或相關領域的碩士或博士學位
-對深度學習,機器學習,神經網絡,transformer有深入的理解,有項目中應用的經驗
-具有良好的編程能力,有python和c++編程經驗和深度學習框架使用經驗,熟悉pytorch、megatron-lm
-能閱讀和理解技術研究論文,并能將論文的觀點轉化為實際的算法
-善于解決問題和適應新的技術變化
工作地點
地址:錦州


職位發布者
HR
百度在線網絡技術(北京)有限公司


-
互聯網·電子商務
-
1000人以上
-
私營·民營企業
-
北京海淀區上地十街10號百度大廈