跳至主要内容

一次 AWS SageMaker 的上手体验

SageMaker 是个啥

用 AWS 官方的语言来说,SageMaker 是一个完全托管的机器学习平台。

作为一个并不懂机器学习,之前也没了解过 SageMaker 的小白,今天看了 AWS 中国“User Group 社区”的直播后,也亲自上手体验了一下 SageMaker。

直播里面有两个小实验,体验了其中最简单的一个——在 SageMaker上部署一个 GPT-J 模型。GPT-J 是一个基于 Open AI 的 GTP-3 的自然语言处理模型,可以用作文本预测。

部署了这个模型后,运行一个简单的预测。

开始!

首先打开 SageMaker,启动一个 Jupyter Notebook 实例,规格选了 ml.t2-medium

大概等个 2-3 分钟,Jupyter 实例就启动了。

然后进到 JupyterLab 里面,打开终端,克隆实验代码

打开 dploy-gptj.ipynb 这个 Notebook,一步一步执行。

GPT-J 的模型存储在公有 S3 上面。通过代码部署推理实例,实例数量和大小在代码里面定义好了。

等个大概 5 分钟左右,就在 Endpoints 里面看到推理实例启动成功!

然后按照实验教程,让 GPT-J 模型预测“香港最高的建筑是……”和“香港最贵的物业是……”。

也不知道它回答的对不对,不过感觉可真是厉害。

弄完之后删除推理实例和 Jupyter 实例,避免造成额外费用。

感触

虽说是一次简单的体验,但对于机器学习小白的我来说很震撼,心想:“没想到机器学习平台已经这么方便了,看来还有很多的东西要学啊。”

评论

此博客中的热门博文

归并排序的两种方式

概述 归并排序是目前最高效的排序算法之一,它兼具稳定和低复杂度的特点,其最坏时间复杂度 O(nlogn) ,空间复杂度 O(n) 。 归并排序采用计算机科学的分治思想,因此有两种实现方式:自顶向下和自底向上。

博客迁移至 Blogger 小记

最早博客是基于 Hexo 搭建,并部署在 Github Page 上。后来因为访问速度原因,迁至大陆腾讯云裸机器上(因为做活动一年¥100不到),使用 Nginx 代理静态文件。裸机器到期后迁至腾讯云 cos 里,成本倒是降低了,但不久备案被吊销,博客停更。