工作職責(zé):
1、設(shè)計(jì)和實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)算法和系統(tǒng),用于解決復(fù)雜的決策問題。
2、構(gòu)建強(qiáng)化學(xué)習(xí)模型和環(huán)境,進(jìn)行模型訓(xùn)練和優(yōu)化,以實(shí)現(xiàn)智能決策和行為。
3、進(jìn)行強(qiáng)化學(xué)習(xí)算法的調(diào)試和性能優(yōu)化,以提高模型的收斂性和效率。
4、開展與強(qiáng)化學(xué)習(xí)相關(guān)的研究和創(chuàng)新,跟蹤最新的發(fā)展和技術(shù)趨勢,并將其應(yīng)用于實(shí)際項(xiàng)目中。
5、分析和評估強(qiáng)化學(xué)習(xí)模型的表現(xiàn),提供相應(yīng)的改進(jìn)策略和建議。
6、與團(tuán)隊(duì)合作,包括數(shù)據(jù)科學(xué)家、軟件工程師和產(chǎn)品經(jīng)理,共同推進(jìn)強(qiáng)化學(xué)習(xí)項(xiàng)目的開發(fā)和交付。
任職要求:
1、學(xué)術(shù)背景:計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)或相關(guān)領(lǐng)域的學(xué)士、碩士或博士學(xué)位。
2、熟悉強(qiáng)化學(xué)習(xí)的基本概念、算法和技術(shù),如馬爾可夫決策過程、Q-學(xué)習(xí)、策略梯度等。
3、掌握常見的強(qiáng)化學(xué)習(xí)框架和工具,如OpenAI Gym、TensorFlow等,并能夠使用它們進(jìn)行模型的實(shí)現(xiàn)和訓(xùn)練。
4、具備數(shù)學(xué)和統(tǒng)計(jì)學(xué)的基礎(chǔ)知識,了解概率論、優(yōu)化方法等與強(qiáng)化學(xué)習(xí)相關(guān)的數(shù)學(xué)概念。
5、具備編程和軟件開發(fā)的能力,能夠?qū)崿F(xiàn)和調(diào)試復(fù)雜的強(qiáng)化學(xué)習(xí)算法和系統(tǒng)。
6、具備問題解決和分析能力,能夠?qū)?shí)際決策問題轉(zhuǎn)化為可行的強(qiáng)化學(xué)習(xí)解決方案。
7、良好的溝通和團(tuán)隊(duì)合作能力,能夠與團(tuán)隊(duì)成員合作,共同推動項(xiàng)目的成功交付。
對本職位有意向者,請發(fā)簡歷至hr-bobomao@tom.com