TensorFlow-谷歌深度学习库 手把手教你如何使用谷歌深度学习云平台 (2)

TensorFlow-谷歌深度学习库 手把手教你如何使用谷歌深度学习云平台

创建一个空的setup.py文件, 在trainer文件夹中创建一个空的__init__.py

2. 确认你云端上保存你的所用中间或最终输出结果(比如checkpoint文件)的路径, 这一步很重要!!!!否则你不知道在哪找你训练的参数呀!

TensorFlow-谷歌深度学习库 手把手教你如何使用谷歌深度学习云平台

在Google Cloud Platfrom左侧的导航栏中选择存储,创建存储分区

TensorFlow-谷歌深度学习库 手把手教你如何使用谷歌深度学习云平台

如上图所示,创建一个分区,选择regional,位置为us-east1可以使用gpu!!!而且比较便宜呀~~~

这样你在云端上就有了一个路径,比如我的情况就是gs://yzm_bucket

创建完成后,在你本地的代码中把你所有的输出路径都要替换成你的云端路径。这样在云端训练时才能把结果也保存在云端。

比如这样:path_to_latest_checkpoint_file = saver.save(sess, \'gs://yzm_bucket/log/latest.ckpt\')

3. 确认本地代码中所需要的依赖

需要查看cloud ml runtime的版本信息 -> https://cloud.google.com/ml-engine/docs/runtime-version-list

目前的化Cloud ML runtime最新版本为1.6, 支持python 3.5。 查看你想使用的版本有没有所有你所依赖的包。 如果你的程序用pip安装了一些python模块(如pillow)但是使用的runtime版本中并不包含这些包,你需要手动设置你的包依赖。 请在setup.py中(如果你用标准的项目结构,就是你traniner的根目录即它的上一层)添加如下信息:

from setuptools import find_packages from setuptools import setup REQUIRED_PACKAGES = [\'some_PyPI_package>=1.0\'] setup( name=\'trainer\', version=\'0.1\', install_requires=REQUIRED_PACKAGES, packages=find_packages(), include_package_data=True, description=\'My trainer application package.\' )

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwjdxx.html