最近我们一直在与 实验室中的人工智能. 这产生了广泛的结果,从意外地使具有各种配置和软件的整个操作系统变得乏味到需要设置并具有一个基准图像以跨平台工作。 我们认为,在我们完成设置用于人工智能 (AI) 和开发的基础映像的过程中,有必要概述基本的入门步骤。
最近我们一直在与 实验室中的人工智能. 这产生了广泛的结果,从意外地使具有各种配置和软件的整个操作系统变得乏味到需要设置并具有一个基准图像以跨平台工作。 我们认为,在我们完成设置用于人工智能 (AI) 和开发的基础映像的过程中,有必要概述基本的入门步骤。
无论您是专注于推理还是训练,这都适用。 拥有一个干净、有条理的环境对于高效开发至关重要,因此为了本指南的目的,我们将假设您已经全新安装了您喜欢的操作系统 (OS)。
AI 设置指南 – 保持一致
自从为我的 AI 和 ML 项目实施这个标准基础图像以来,我看到了效率可重复性和生产力的显着提高。 结构良好且全面的环境大大减少了我花在设置和故障排除我们测试的各种服务器和工作站上的时间。 由于我们与 AI 合作的一部分是帮助测试和审查新平台,因此可重复性确保我们能够始终如一地重现我们的结果,从而加强我们发现的有效性和可靠性。
采用这一标准的一个特别值得注意的成果是凯文的转变。 在引入这个基线之前,Kevin 不得不首当其冲地承担所有的工作,经常单枪匹马地处理库冲突和工具版本不匹配带来的混乱。
然而,自从引入标准化基础图像以来,Kevin 已经能够委派更多任务并专注于真正重要的事情——比如寻找完美的办公椅。 看来我和 Kevin 终于发现了和谐高效的 AI 开发环境的秘诀。 现在,凯文终于可以享受他的早晨咖啡,而不必担心他将如何解决我一夜之间造成的最新兼容性危机。
本指南的设计用途广泛,可满足各种需求和偏好。 无论您是希望创建用于在整个组织中部署的标准化基础映像的 IT 专业人员,还是寻求建立干净高效的 AI 开发环境的个人开发人员,本指南都提供了必要的步骤和见解,说明您为什么可以或可能不需要特定的工具来实现您的目标。 通过遵循概述的步骤,您将做好充分准备,为您的 AI 和机器学习项目创建稳健、可重复且可靠的基础。
获得使用 AI 的基本清洁环境的步骤
- 安装正确的 NVIDIA 驱动程序 对于您的显卡:要充分发挥 GPU 的潜力来执行 AI 任务,必须安装合适的 NVIDIA 驱动程序。 这些驱动程序支持 GPU 和操作系统之间的通信,确保最佳性能和稳定性。
- 安装 NVIDIA CUDA 工具包:NVIDIA CUDA 工具包是一个并行计算平台和编程模型,允许开发人员利用 NVIDIA GPU 的强大功能执行通用计算任务,包括 AI 和深度学习应用程序。 通过安装 CUDA 工具包,您可以利用 GPU 的功能实现更快、更高效的 AI 开发。
为什么 NVIDIA CUDA 工具包很重要?
它提供了一个全面的开发环境,其中包括 GPU 加速库、调试和优化工具,以及一个可以更轻松地编写和维护 GPU 代码的编程模型。
- 安装 蟒蛇:Anaconda 是 Python 和 R 编程语言的流行发行版,专注于数据科学和机器学习。 它预装了各种用于 AI 开发的基本库和工具,例如 NumPy、pandas、TensorFlow 和 PyTorch。
为什么 Anaconda 很重要?
Anaconda 简化了设置和管理不同编程环境的过程,使其更容易与各种 AI 框架和库一起工作,而不会出现兼容性问题。
Anaconda 环境是一项强大的功能,它允许您为不同的项目创建隔离空间,每个项目都有自己独特的一组库和包。 这些环境有助于保持开发工作区的整洁和组织,因为它们可以防止不同项目之间的依赖关系发生冲突。 对于像我这样容易安装过多 Python 包的人来说,Anaconda 环境是救命稻草——它们使我免于将我的 Python 基础环境变成噩梦般的冲突库大杂烩。
使用 Anaconda 环境对于高效的 AI 开发至关重要,因为它使开发人员能够毫不费力地管理和切换多个项目。 这在使用 AI 框架和库时尤为重要,因为它们通常具有特定的版本要求和依赖性。
通过让您的项目保持独立和自包含,Anaconda 环境允许您沉迷于对 Python 包的热爱,而不会牺牲稳定性和可重现性。 他们提倡开发中的最佳实践,确保您的 AI 项目保持井井有条、可靠且易于协作,同时让您保持理智。
- 安装 Visual Studio代码 和 Visual Studio 2022社区: Visual Studio Code (VSCode) 和 Visual Studio 2022 Community 是两个强大的 AI 开发集成开发环境 (IDE)。 两种 IDE 都提供高级代码编辑、调试和协作功能,使编写、测试和共享 AI 项目变得更加容易。
为什么这些 IDE 很重要,它们有什么区别?
VSCode 是一个轻量级的跨平台 IDE,具有庞大的扩展生态系统,使其具有高度可定制性,适用于各种编程语言和框架。 相比之下,Visual Studio 2022 Community 是一个功能更丰富、仅限 Windows 的 IDE,它提供额外的工具和服务,例如对 Git 版本控制和 Microsoft Azure 集成的内置支持。
根据您的特定需求和偏好,您可能会发现在系统上同时安装这两个 IDE 以获得更大的灵活性是有利的。 请注意,如果您不选择使用 Visual Studio Community,您将需要安装 Git,我们喜欢 Windows版Git.
- 安装 Jupyter笔记本: Jupyter Notebook 是一个基于 Web 的交互式计算环境,允许您创建和共享包含实时代码、方程式、可视化和叙述文本的文档。 它广泛用于数据科学和机器学习中的实验、可视化和协作。
在你的 Anaconda 环境中安装 JupyterLab pip
喜欢这个:
pip install jupyterlab
为什么 Jupyter 笔记本很重要?
它使您能够快速制作原型并共享您的 AI 项目,从而更轻松地与他人协作并迭代您的工作。
- 安装 张量板:TensorBoard 是 TensorFlow 的可视化工具,可帮助您理解、调试和优化您的 AI 模型。 它提供了各种可视化和指标,可以帮助深度学习模型的开发和调整。
为什么 TensorBoard 很重要?
它提供了对 AI 模型训练过程的宝贵见解,使您能够跟踪进度、发现问题并就如何改进模型做出数据驱动的决策。
- 安装 流量:MLflow 是一个开源平台,用于管理端到端机器学习生命周期,包括实验、可重复性和部署。 它提供了一个用于跟踪实验、存储工件和部署模型的集中式系统。
为什么 MLflow 很重要?
它使您能够更高效地管理和组织实验、共享结果和部署模型,从而简化了机器学习工作流程。 这样可以更轻松地与队友协作,并确保您的 AI 项目一致且可重现。
分手思考
作为您自己的办公和安全标准软件套件的补充,这些工具和软件包可以创建一个全面的基础映像,以便在组织的一个子集中进行部署,从而为 AI 和 ML 开发奠定坚实的基础。 此基础映像对于刚刚开始探索 AI 和 ML 功能的组织特别有用,因为它确保必要的工具和框架可供开发人员立即开始使用。
众所周知,使用基础映像标准化开发环境可以极大地有利于组织,因为它简化了设置过程。 随着当今快速发展和变化的 AI 环境的起泡,减少不同 AI 框架和库之间潜在的兼容性问题变得更加重要。 虽然在撰写本文时,这些是一些最流行的首选工具和软件包,但了解最新趋势非常重要。
虽然此基本安装提供了广泛且动态的环境,但开发人员仍然可以根据他们的特定需求和项目灵活地定制他们的工作区。 他们可以根据需要轻松添加或删除库、框架和工具,根据 AI 和 ML 项目的独特挑战和目标定制开发环境。 标准化和定制化之间的平衡将是确保您的组织能够有效且高效地利用 AI 和 ML 的力量来推动创新和成功的关键。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅