這篇文章主要介紹了TensorFlow入門使用 tf.train.Saver()儲存模型,現在分享給大家,也給大家做個參考。一起過來看看吧
關於模型儲存的一點心得
saver = tf.train.Saver(max_to_keep=3)
在定義 saver 的時候一般會定義最多儲存模型的數量,一般來說,如果模型本身很大,我們需要考慮到硬碟大小。如果你需要在當前訓練好的模型的基礎上進行 fine-tune,那麼儘可能多的儲存模型,後繼 fine-tune 不一定從最好的 ckpt 進行,因為有可能一下子就過擬合了。但是如果儲存太多,硬碟也有壓力呀。如果只想保留最好的模型,方法就是每次迭代到一定步數就在驗證集上計算一次 accuracy 或者 f1 值,如果本次結果比上次好才儲存新的模型,否則沒必要儲存。
如果你想用不同 epoch 儲存下來的模型進行融合的話,3到5 個模型已經足夠了,假設這各融合的模型成為 M,而最好的一個單模型稱為 m_best, 這樣融合的話對於M 確實可以比 m_best 更好。但是如果拿這個模型和其他結構的模型再做融合的話,M 的效果並沒有 m_best 好,因為M 相當於做了平均操作,減少了該模型的“特性”。
但是又有一種新的融合方式,就是利用調整學習率來擷取多個局部最優點,就是當 loss 降不下了,儲存一個 ckpt, 然後開大學習率繼續尋找下一個局部最優點,然後用這些 ckpt 來做融合,還沒試過,單模型肯定是有提高的,就是不知道還會不會出現上面再與其他模型融合就沒提高的情況。
如何使用 tf.train.Saver() 來儲存模型
之前一直出錯,主要是因為坑爹的編碼問題。所以要注意檔案的路徑絕對不不要出現什麼中文呀。
import tensorflow as tfconfig = tf.ConfigProto()config.gpu_options.allow_growth = Truesess = tf.Session(config=config)# Create some variables.v1 = tf.Variable([1.0, 2.3], name="v1")v2 = tf.Variable(55.5, name="v2")# Add an op to initialize the variables.init_op = tf.global_variables_initializer()# Add ops to save and restore all the variables.saver = tf.train.Saver()ckpt_path = './ckpt/test-model.ckpt'# Later, launch the model, initialize the variables, do some work, save the# variables to disk.sess.run(init_op)save_path = saver.save(sess, ckpt_path, global_step=1)print("Model saved in file: %s" % save_path)
Model saved in file: ./ckpt/test-model.ckpt-1
注意,在上面儲存完了模型之後。應該把 kernel restart 之後才能使用下面的模型匯入。否則會因為兩次命名 “v1” 而導致名字錯誤。
import tensorflow as tfconfig = tf.ConfigProto()config.gpu_options.allow_growth = Truesess = tf.Session(config=config)# Create some variables.v1 = tf.Variable([11.0, 16.3], name="v1")v2 = tf.Variable(33.5, name="v2")# Add ops to save and restore all the variables.saver = tf.train.Saver()# Later, launch the model, use the saver to restore variables from disk, and# do some work with the model.# Restore variables from disk.ckpt_path = './ckpt/test-model.ckpt'saver.restore(sess, ckpt_path + '-'+ str(1))print("Model restored.")print sess.run(v1)print sess.run(v2)
INFO:tensorflow:Restoring parameters from ./ckpt/test-model.ckpt-1
Model restored.
[ 1. 2.29999995]
55.5
匯入模型之前,必須重新再定義一遍變數。
但是並不需要全部變數都重新進行定義,只定義我們需要的變數就行了。
也就是說,你所定義的變數一定要在 checkpoint 中存在;但不是所有在checkpoint中的變數,你都要重新定義。
import tensorflow as tfconfig = tf.ConfigProto()config.gpu_options.allow_growth = Truesess = tf.Session(config=config)# Create some variables.v1 = tf.Variable([11.0, 16.3], name="v1")# Add ops to save and restore all the variables.saver = tf.train.Saver()# Later, launch the model, use the saver to restore variables from disk, and# do some work with the model.# Restore variables from disk.ckpt_path = './ckpt/test-model.ckpt'saver.restore(sess, ckpt_path + '-'+ str(1))print("Model restored.")print sess.run(v1)
INFO:tensorflow:Restoring parameters from ./ckpt/test-model.ckpt-1
Model restored.
[ 1. 2.29999995]
tf.Saver([tensors_to_be_saved]) 中可以傳入一個 list,把要儲存的 tensors 傳入,如果沒有給定這個list的話,他會預設儲存當前所有的 tensors。一般來說,tf.Saver 可以和 tf.variable_scope() 巧妙搭配,可以參考: 【遷移學習】往一個已經儲存好的模型添加新的變數並進行微調