{ "cells": [ { "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "GfkmyI58wjbt" }, "source": [ "# Python | Урок 1: pandas & sklearn\n", "\n", "## Загрузка необходимых библиотек\n", "\n", "Для работы нам понадобятся две библиотеки:\n", "\n", "- **pandas**: при помощи нее мы считаем из файла таблицу с данными \n", "- **sklearn**: библиотека для машинного обучения, из нее нам понадобится модуль **tree** для работы с решающими деревьями" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "colab": {}, "colab_type": "code", "id": "z6JWaPMexEiZ" }, "outputs": [], "source": [ "# Подключаем нужные библиотеки\n", "\n", "import pandas\n", "from sklearn import tree" ] }, { "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "qOjB9X0qxRP3" }, "source": [ "### 1. Загружаем данные при помощи библиотеки `pandas`\n", "\n", "В файле `dota2_skill_train.csv` содержатся данные о матчах, показателях игрока и показателях за последние 16 матчей \n", "почти по 100,000 игроков в Dota2" ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "colab": {}, "colab_type": "code", "id": "YPtbalB-ycxM" }, "outputs": [], "source": [ "# Для чтения данных используем метод read_csv\n", "\n", "table = pandas.read_csv('dota2_skill_train.csv', index_col='id')" ] }, { "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "MtVjjFcGyq1Z" }, "source": [ "Посмотреть на первые строчки таблицы можно при помощи метода `head():`" ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 204 }, "colab_type": "code", "id": "THYQXt-Rytfe", "outputId": "55f0e802-fbd3-4bf4-c81e-9d80d0373f68" }, "outputs": [ { "data": { "text/html": [ "
\n", " | skilled | \n", "player_team | \n", "winner_team | \n", "duration | \n", "pre_game_duration | \n", "first_blood_time | \n", "first_blood_claimed | \n", "hero_id | \n", "hero_pick_order | \n", "leaver_status | \n", "... | \n", "avg_deaths_x16 | \n", "avg_assists_x16 | \n", "avg_gpm_x16 | \n", "avg_xpm_x16 | \n", "best_kills_x16 | \n", "best_assists_x16 | \n", "best_gpm_x16 | \n", "best_xpm_x16 | \n", "win_streak | \n", "best_win_streak | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
id | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
7 | \n", "1 | \n", "dire | \n", "dire | \n", "2140 | \n", "90 | \n", "129 | \n", "0 | \n", "90 | \n", "9 | \n", "0 | \n", "... | \n", "8 | \n", "15 | \n", "352 | \n", "430 | \n", "10 | \n", "30 | \n", "551 | \n", "745 | \n", "2 | \n", "5 | \n", "
8 | \n", "0 | \n", "radiant | \n", "radiant | \n", "2138 | \n", "90 | \n", "174 | \n", "0 | \n", "5 | \n", "5 | \n", "0 | \n", "... | \n", "9 | \n", "19 | \n", "294 | \n", "425 | \n", "13 | \n", "37 | \n", "445 | \n", "717 | \n", "2 | \n", "12 | \n", "
12 | \n", "0 | \n", "radiant | \n", "radiant | \n", "3547 | \n", "90 | \n", "360 | \n", "0 | \n", "81 | \n", "7 | \n", "0 | \n", "... | \n", "7 | \n", "9 | \n", "493 | \n", "543 | \n", "23 | \n", "18 | \n", "691 | \n", "762 | \n", "3 | \n", "3 | \n", "
13 | \n", "1 | \n", "dire | \n", "radiant | \n", "1878 | \n", "90 | \n", "28 | \n", "0 | \n", "74 | \n", "9 | \n", "0 | \n", "... | \n", "7 | \n", "12 | \n", "515 | \n", "583 | \n", "25 | \n", "34 | \n", "869 | \n", "935 | \n", "0 | \n", "6 | \n", "
14 | \n", "1 | \n", "dire | \n", "radiant | \n", "2232 | \n", "90 | \n", "129 | \n", "0 | \n", "14 | \n", "6 | \n", "0 | \n", "... | \n", "10 | \n", "16 | \n", "337 | \n", "452 | \n", "34 | \n", "43 | \n", "672 | \n", "797 | \n", "0 | \n", "9 | \n", "
5 rows × 57 columns
\n", "