Руководство по ML.NET — начало работы через 10 минут

Скачать и добавить данные

Загрузите наборы данных Sentiment Labeled Sentences из репозитория машинного обучения UCI. Разархивируйте sentiment labelled sentences.zip и сохраните файл yelp_labelled.txt в каталоге myMLApp.

Ваш Обозреватель решений должен выглядеть примерно так:

Обозреватель решений Visual Studio

Каждая строка в yelp_labelled.txt представляет собой отдельный отзыв о ресторане, оставленный пользователем Yelp. В первом столбце приведен комментарий пользователя, а втором столбце указана тональность текста (0 — отрицательная, 1 — положительная). Столбцы разделены знаками табуляции, а набор данных не имеет заголовка. Данные выглядят следующим образом:

yelp_labelled.txt
Wow... Loved this place.	        1
Crust is not good.	        0
Not tasty and the texture was just nasty.	        0

Добавить данные

В конструкторе моделей вы можете добавлять данные из локального файла или подключаться к базе данных SQL Server. В этом случае вы добавите yelp_labelled.txt из файла.

  1. Выберите Файл как тип источника входных данных.

  2. Найдите yelp_labelled.txt. После выбора набора данных в разделе Предварительный просмотр данных появится предварительный просмотр ваших данных. Поскольку в вашем наборе данных нет заголовка, заголовки генерируются автоматически ("col0" и "col1").

  3. В разделе Столбец для прогнозирования (метка) выберите "col1". Ярлык — это то, что вы прогнозируете. В данном случае это тональность во втором столбце ("col1") набора данных.

  4. Столбцы, которые помогают прогнозировать метку, называются Функции. Все столбцы в наборе данных, кроме метки, автоматически выбираются как объекты. В этом случае столбец комментариев обзора ("col0") является столбцом Feature. Вы можете обновить столбцы объектов и изменить другие параметры загрузки данных в разделе Дополнительные параметры данных, но в этом примере это не обязательно.

Шаг данных конструктора модели

После добавления данных перейдите к шагу Обучение.

Продолжить