Výukový program Python

Python HOME Úvod do Pythonu Začínáme s Pythonem Syntaxe Pythonu Komentáře Pythonu Proměnné Pythonu Datové typy Pythonu Python čísla Python Casting Python řetězce Python Booleans Operátoři Pythonu Seznamy Pythonu Python n-tice Sady Pythonu Slovníky Pythonu Python If...Else Python While Loops Python pro smyčky Funkce Pythonu Python Lambda Pole Python Třídy/objekty Pythonu Dědičnost Pythonu Iterátory Pythonu Rozsah Pythonu Moduly Pythonu Data v Pythonu Matematika Pythonu Python JSON Python RegEx Python PIP Zkuste Python... Kromě Vstup uživatele Pythonu Formátování řetězců v Pythonu

Manipulace se soubory

Práce se soubory Python Soubory pro čtení Pythonu Python Zápis/Vytváření souborů Python mazat soubory

Moduly Pythonu

Výukový program NumPy Návod Panda Výukový program Scipy

Python Matplotlib

Úvod do Matplotlib Matplotlib Začínáme Matplotlib Pyplot Vykreslování Matplotlib Markery Matplotlib Linka Matplotlib Štítky Matplotlib Matplotlib Grid Matplotlib Subplots Matplotlib Scatter Bary Matplotlib Histogramy Matplotlib Koláčové grafy Matplotlib

Strojové učení

Začínáme Střední střední režim Standardní odchylka Percentil Distribuce dat Normální distribuce dat Bodový diagram Lineární regrese Polynomiální regrese Vícenásobná regrese Měřítko Vlak/test Rozhodovací strom

Python MySQL

MySQL Začínáme Vytvořit databázi MySQL Vytvořit tabulku MySQL Vložit MySQL Vyberte MySQL Kde MySQL Pořadí MySQL podle Smazat MySQL MySQL Drop Table Aktualizace MySQL Limit MySQL Připojte se k MySQL

Python MongoDB

MongoDB Začněte Vytvořit databázi MongoDB Vytvořit sbírku MongoDB Vložení MongoDB Najít MongoDB Dotaz MongoDB Řazení MongoDB Smazat MongoDB MongoDB Drop Collection Aktualizace MongoDB Limit MongoDB

Reference Pythonu

Přehled Pythonu Vestavěné funkce Pythonu Metody pythonských řetězců Metody seznamu v Pythonu Metody slovníku Python Metody Python Tuple Metody sady Python Metody souborů Python Klíčová slova Pythonu Výjimky v Pythonu Slovník Pythonu

Reference modulu

Náhodný modul Modul požadavků Modul statistiky Matematický modul cMath modul

Jak na to Python

Odebrat duplikáty seznamu Obrátit řetězec Přidejte dvě čísla

Příklady Pythonu

Příklady Pythonu Kompilátor Pythonu Cvičení Python Pythonský kvíz Python certifikát

Strojové učení

Díky strojovému učení se počítač učí ze studia dat a statistik.

Strojové učení je krokem směrem k umělé inteligenci (AI).

Machine Learning je program, který analyzuje data a učí se předpovídat výsledek.

Kde začít?

V tomto tutoriálu se vrátíme k matematice a studijní statistice a k tomu, jak vypočítat důležitá čísla na základě datových souborů.

Také se naučíme, jak používat různé moduly Pythonu, abychom získali odpovědi, které potřebujeme.

A naučíme se dělat funkce, které jsou schopny předvídat výsledek na základě toho, co jsme se naučili.


Soubor dat

V mysli počítače je soubor dat jakýkoli soubor dat. Může to být cokoli od pole až po kompletní databázi.

Příklad pole:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Příklad databáze:

CarnameBarvaStáříRychlostAutoPass
BMWČervené599Y
VolvoČerná786Y
VWšedá887N
VWbílý788Y
Brodbílý2111Y
VWbílý1786Y
TeslaČervené2103Y
BMWČerná987Y
Volvošedá494N
Brodbílý1178N
Toyotašedá1277N
VWbílý985N
Toyotamodrý686Y

Při pohledu na pole můžeme odhadnout, že průměrná hodnota je pravděpodobně kolem 80 nebo 90 a také jsme schopni určit nejvyšší a nejnižší hodnotu, ale co jiného můžeme dělat?

A když se podíváme do databáze, můžeme vidět, že nejoblíbenější barva je bílá a nejstarší auto má 17 let, ale co kdybychom dokázali předpovědět, zda auto mělo AutoPass, pouhým pohledem na ostatní hodnoty?

K tomu slouží strojové učení! Analýza dat a předpovídání výsledku!

Ve strojovém učení je běžné pracovat s velmi velkými datovými sadami. V tomto tutoriálu se pokusíme co nejvíce usnadnit pochopení různých konceptů strojového učení a budeme pracovat s malými, snadno srozumitelnými datovými sadami.


Typy dat

Pro analýzu dat je důležité vědět, s jakým typem dat máme co do činění.

Datové typy můžeme rozdělit do tří hlavních kategorií:

  • Číselné
  • Kategorický
  • řadový

Číselné údaje jsou čísla a lze je rozdělit do dvou číselných kategorií:

  • Diskrétní data
    – čísla, která jsou omezena na celá čísla. Příklad: Počet projíždějících aut.
  • Spojitá data
    – čísla, která mají nekonečnou hodnotu. Příklad: Cena položky nebo velikost položky

Kategorická data jsou hodnoty, které nelze vzájemně měřit. Příklad: hodnota barvy nebo jakékoli hodnoty ano/ne.

Ordinální data jsou jako kategorická data, ale lze je vzájemně měřit. Příklad: školní známky, kde A je lepší než B a tak dále.

Když budete znát typ dat vašeho zdroje dat, budete moci vědět, jakou techniku ​​použít při jejich analýze.

Více o statistice a analýze dat se dozvíte v dalších kapitolách.