<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企業資訊 » 熱點 » 正文

      在昇騰平臺上對TensorFlow網絡進行姓能

      放大字體  縮小字體 發布日期:2023-03-19 13:34:53    作者:葉國慶    瀏覽次數:147
      導讀

      本文分享自華為云社區《在昇騰平臺上對TensorFlow網絡進行性能調優-云社區-華為云》,作者:昇騰CANN 。用戶將TensorFlow訓練網絡遷移到昇騰平臺后,如果存在性能不達標的問題,就需要進行調優。本文就帶大家了解在

      本文分享自華為云社區《在昇騰平臺上對TensorFlow網絡進行性能調優-云社區-華為云》,作者:昇騰CANN 。

      用戶將TensorFlow訓練網絡遷移到昇騰平臺后,如果存在性能不達標的問題,就需要進行調優。本文就帶大家了解在昇騰平臺上對TensorFlow訓練網絡進行性能調優的常用手段。

      首先了解下性能調優的全流程:

      當TensorFlow訓練網絡性能不達標時,首先可嘗試昇騰平臺提供的“三板斧”操作,即上圖中的“基本提升手段”:使能自動混合精度 > 進行親和接口的替換 > 使能訓練迭代循環下沉 > 使用AOE工具進行調優。

      基本調優操作完成后,需要再次執行模型訓練并評估性能,如果性能達標了,調優即可結束;如果未達標,需要使用Profling工具采集詳細的性能數據進一步分析,從而找到性能瓶頸點,并進一步針對性的解決,這部分調優操作需要用戶有一定的經驗,難度相對較大,我們將這部分調優操作稱為進階調優。

      本文主要帶大家詳細了解基本調優操作,即上圖中的灰色底紋部分。

      使能自動混合精度

      混合精度是業內通用的性能提升方式,通過降低部分計算精度提升數據計算的并行度。混合計算訓練方法通過混合使用float16和float32數據類型來加速深度神經網絡的訓練過程,并減少內存使用和存取,從而可以提升訓練網絡性能,同時又能基本保證使用float32訓練所能達到的網絡精度。

      Ascend平臺提供了“precision_mode”參數用于配置網絡的精度模式,用戶可以在訓練腳本的運行配置中添加此參數,并將取值配置為“allow_mix_precision”,從而使能自動混合精度,下面以手工遷移的訓練腳本為例,介紹配置方法。

    • Estimator模式下,在NPURunConfig中添加precision_mode參數設置精度模式:npu_config=NPURunConfig( model_dir=FLAGS.model_dir, save_checkpoints_steps=FLAGS.save_checkpoints_steps, session_config=tf.ConfigProto(allow_soft_placement=True,log_device_placement=False), precision_mode="allow_mix_precision" )
    • sess.run模式下,通過session配置項precision_mode設置精度模式:config = tf.ConfigProto(allow_soft_placement=True) custom_op = config.graph_options.rewrite_options.custom_optimizers.add() custom_op.name = "NpuOptimizer" custom_op.parameter_map["use_off_line"].b = True custom_op.parameter_map["precision_mode"].s = tf.compat.as_bytes("allow_mix_precision") … with tf.Session(config=config) as sess: print(sess.run(cost))親和接口替換

      針對TensorFlow訓練網絡中的dropout、gelu接口,Ascend平臺提供了硬件親和的替換接口,從而使網絡獲得更優性能。

    • 對于訓練腳本中的nn.dropout,建議替換為Ascend對應的API實現,以獲得更優性能:layers = npu_ops.dropout()
    • 若訓練腳本中存在layers.dropout、tf.layers.Dropout、tf.keras.layers.Dropout、tf.keras.layers.SpatialDropout1D、tf.keras.layers.SpatialDropout2D、tf.keras.layers.SpatialDropout3D接口,建議增加頭文件引用:from npu_bridge.estimator.npu import npu_convert_dropout
    • 對于訓練腳本中的gelu接口,建議替換為Ascend提供的gelu接口,以獲得更優性能。

      例如,TensorFlow原始代碼:

      遷移后的代碼:

      from npu_bridge.estimator.npu_unary_ops import npu_unary_opslayers = npu_unary_ops.gelu(x)訓練迭代循環下沉

      訓練迭代循環下沉是指在Host調用一次,在Device執行多次迭代,從而減少Host與Device間的交互次數,縮短訓練時長。用戶可通過iterations_per_loop參數指定訓練迭代的次數,該參數取值大于1即可使能訓練迭代循環下沉的特性。

      使用該特性時,要求訓練腳本使用TF Dataset方式讀數據,并開啟數據預處理下沉,即enable_data_pre_proc開關配置為True,例如sess.run配置示例如下:

      custom_op.parameter_map["enable_data_pre_proc"].b = True

      其他使用約束,用戶可參見昇騰文檔中心(昇騰社區-官網丨昇騰萬里 讓智能無所不及)的《TensorFlow模型遷移和訓練指南》。

      Estimator模式下,通過NPURunConfig中的iterations_per_loop參數配置訓練迭代循環下沉的示例如下:

      session_config=tf.ConfigProto(allow_soft_placement=True)config = NPURunConfig(session_config=session_config, iterations_per_loop=10)AOE自動調優

      昇騰平臺提供了AOE自動調優工具,可對網絡進行子圖調優、算子調優與梯度調優,生成最優調度策略,并將最優調度策略固化到知識庫。模型再次訓練時,無需開啟調優,即可享受知識庫帶來的收益。

      建議按照如下順序使用AOE工具進行調優:

      訓練場景下使能AOE調優有兩種方式:

    • 通過設置環境變量啟動AOE調優。# 1:子圖調優 # 2:算子調優 # 4:梯度調優 export AOE_MODE=2
    • 修改訓練腳本,通過“aoe_mode”參數指定調優模式,例如:

      sess.run模式,訓練腳本修改方法如下:

      custom_op.parameter_map["aoe_mode"].s = tf.compat.as_bytes("2")

      estimator模式下,訓練腳本修改方法如下:

      config = NPURunConfig( session_config=session_config, aoe_mode=2)

      以上就是TensorFlow網絡在昇騰平臺上進行性能調優的常見手段。關于更多文檔介紹,可以在昇騰文檔中心查看,您也可在昇騰社區在線課程板塊(昇騰社區-官網丨昇騰萬里 讓智能無所不及)學習視頻課程,學習過程中的任何疑問,都可以在昇騰論壇互動交流!

      相關參考:

      [1]昇騰文檔中心

      [2]昇騰社區在線課程

      [3]昇騰論壇

      關注#華為云開發者聯盟#點擊下方,第一時間了解華為云新鮮技術~

      華為云博客_大數據博客_AI博客_云計算博客_開發者中心-華為云

    •  
      (文/葉國慶)
      免責聲明
      本文僅代表作發布者:葉國慶個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 欧美另类黑人巨大videos| 韩国三级黄色片| 麻豆国产高清精品国在线| 欧美三级不卡在线观看| 国产精品无码无在线观看| 国产孕妇孕交一级毛片| 亚洲欧美日韩精品久久久| 中文字幕aⅴ人妻一区二区| 亚洲人成网站看在线播放| 男人j进美女p动态图片| 天天综合网网欲色| 含羞草影院无限在线看| 么公又大又硬又粗又爽视频 | 99久久国产综合精品麻豆| 熟女精品视频一区二区三区| 在线观看午夜亚洲一区| 亚洲第一页在线观看| 884hutv四虎永久7777| 男女一对一免费视频| 在线麻豆国产传媒60在线观看| 午夜男人一级毛片免费| 一个人看的视频www在线| 特黄特色大片免费播放路01| 开心久久婷婷综合中文字幕| 免费在线观看毛片| 99久久综合狠狠综合久久| 男女无遮挡高清性视频直播| 天天干天天爽天天操| 免费啪啪小视频| 91精品国产免费入口| 爽好舒服使劲添我要视频| 国产黄色片在线播放| 亚洲第一极品精品无码久久| 1300部真实小u女视频在线| 欧美精品亚洲精品日韩专区va| 国产精品美女久久久久av超清 | 精品香蕉久久久午夜福利| 无人区免费高清在线观看| 免费传媒网站免费| 3d无尽3d无尽动漫同人| 日韩亚洲欧美综合|