在Notebook中,为了保留数据科学家的工作内容。我们建议为每个用户分配存储卷,并挂载到Notebook的/root
目录, 确保数据科学家的工作内容(代码,数据)得以保留,不会随着容器删除而丢失。
同时在团队开发中,我们建议分配一个共享的存储池,让数据和代码能够在团队中共享。部署Notebook时,如果您声明了配置公共存储,我们会将共享存储会挂载到Notebook的 /root/public
目录中,数据科学家可以通过这个目录,在团队之间可以相互分享数据,代码和模型。
在Kubernets中,通过存储卷和存储声明描述存储对象。 作为集群管理员,分配环境时您需要为每个数据科学家创建属于自己的存储声明,例如用户A和用户B,存储声明的后端可以挂载到相同的 NAS/CPFS,但是必须指定不同的子目录,保证他们工作环境隔离。
您可以通过以下流程创建存储声明,选择合适的存储类型:
- 您需要创建一个用于存放共享数据的存储卷,我们建议命名为
public-data
。(本步骤可选择操作) - 搭建每个数据科学家的Notebook环境,您需要为他创建属于数据科学家自己的存储声明,用于存放他的工作数据,不同的数据科学家需要通过命名区分,本示例中我们命名为
traing-data
。