Core ML

2018-06-12 阅读量

Core ML 概述

借助 Core ML，我们可以将经过训练的机器学习模型整合到我们的应用程序中。

一个训练有素的模型是将机器学习算法来训练数据集合的结果。该模型根据新的输入数据进行预测。例如，一个在某个地区的历史房价上受过培训的模型可能能够在给定卧室和浴室的数量时预测房屋的价格。

Core ML 是领域特定框架和功能的基础。Core ML 支持 Vision 图像分析，Natural Language 的自然语言处理，以及评估学习决策树的GameplayKit。Core ML 本身建立在像Accelerate和BNNS这样的低级原语以及 Metal Performance Shaders 之上。

Core ML 针对器件性能进行了优化，最大限度地减少了内存占用量和功耗。在设备上严格运行可确保用户数据的隐私，并确保我们的应用在网络连接不可用时保持功能和响应。

获取 Core ML 模型

Core ML 支持多种机器学习模型，包括神经网络，tree ensembles，支持向量机和广义线性模型。Core ML 需要 Core ML 模型格式（带有.mlmodel文件扩展名的模型）。

使用 Create ML 和我们的数据，我们可以训练自定义模型来执行任务，如识别图像，从文本中提取含义或查找数值之间的关系。使用 Create ML 进行培训的模型采用 Core ML 模型格式，可以在我们的应用程序中使用。

Apple还提供了几种已经是 Core ML 模型格式的流行的开源模型。我们可以下载这些模型并在我们的应用中使用它们。另外，各种研究团队和大学都会发布他们的模型和培训数据，这些数据可能不在 Core ML 模型中。如果我们要在应用中使用这些模型，需要转换它们，如受训模型转换为 Core ML。

集成 Core ML 模型

将模型添加到 Xcode 项目中

这里我使用的是已经训练好的MoblieNet模型，将模型拖放到项目导航栏中，即可将模型添加到项目中：

在Compile Source中添加 .mlmodel 文件：

在 Xcode 中查看模型的信息：
model
我们可以看到具体的模型类 MoblieNet，数据输入格式以及输出格式，在这里输入的是 image 格式的图片，输出的是字典和字符串。

用代码创建模型

使用模型类的初始化程序来创建模型：MobileNet

1	let model = MobileNet()

获取输入值传递给模型

在这里我们将相册中选中的图片传给模型：

1
2
3

let image = info[UIImagePickerControllerOriginalImage] as! UIImage

let pixelBuffer = image.pixelBuffer(width: 224, height: 224)

使用模型进行预测

在这里我们将模型返回的值显示到界面中，包括结果以及匹配度：

let output = try?model.prediction(image: pixelBuffer!)

let probs = output?.classLabelProbs.sorted { $0.value > $1.value }

if let prob = probs?.first {
  resultLabel.text = "结果：\(prob.key) "

  let probText = String(format:"%.2f %", prob.value * 100)

  probLabel.text = "匹配度：\(probText)%"
}

demo

demo 下载

使用 Create ML 创建模型

在 WWDC18 中，苹果发布了最新的 Xcode10，在 Xcode10 中使用 Create ML 可以自己创建机器学习模型。

图像分类器是经过训练识别图像的机器学习模型。当我们给它一张图片时，它会返回图片的名称。

通过显示大量已标记图像的示例来训练图像分类器。例如，我们可以通过展示大象，长颈鹿，狮子等各种照片来训练图像分类器来识别野生动物园动物。

准备数据

首先准备好用来训练和评估分类器的数据。选择约80％的图像创建一个训练数据集。从剩余的图像创建一个测试数据集。确保任何给定的图像仅出现在这两组中的一组中。

接下来，创建一个名为 Training Data 的文件夹，另一个名为 Testing Data。在每个文件夹中，使用我们的标签作为名称创建子文件夹。然后将图像分类到每个数据集合适的子文件夹中。

我们不需要以任何特定方式命名图像文件或向其添加元数据。只需将它们放入具有正确标签的文件夹中即可。

每个标签至少使用10个图像作为训练集，当然了，越多越好。此外，需要均衡每个种类的图像数量。例如，不要使用10张猎豹的图像和1000大象张图像。

图像可以是统一类型标识符合public.image的任何格式。这包括常见的格式，如JPEG和PNG。这些图像不需要是相同的尺寸，也不需要任何特定的尺寸，但最好使用至少为299x299像素的图像。如果可能的话，训练收集的图像的方式与收集图像以进行预测的方式类似。

需要提供多种图像。例如，使用从不同角度和不同照明条件下显示动物的图像。对于给定标签几乎相同的图像进行训练的分类器往往比在不同图像集上训练的分类器性能更差。

在 Playground 显示图像分类器

准备好数据后，用 macOS 中创建一个新的 Xcode Playground。使用 Playground 创建 MLImageClassifierBuilder 实例并在实时视图中显示它：

// Import CreateMLUI to train the image classifier in the UI.
// For other Create ML tasks, import CreateML instead.
import CreateMLUI 

let builder = MLImageClassifierBuilder()
builder.showInLiveView()