Data Science – Co jsou data?
Co je Data?
Data jsou souhrn informací.
Jedním z účelů Data Science je strukturovat data, aby byla interpretovatelná a snadno se s nimi pracovalo.
Data lze rozdělit do dvou skupin:
- Strukturovaná data
- Nestrukturovaná data
Nestrukturovaná data
Nestrukturovaná data nejsou organizována. Pro účely analýzy musíme data uspořádat.
Strukturovaná data
Strukturovaná data jsou organizována a snáze se s nimi pracuje.
Jak strukturovat data?
Ke strukturování nebo prezentaci dat můžeme použít pole nebo databázovou tabulku.
Příklad pole:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
Následující příklad ukazuje, jak vytvořit pole v Pythonu:
Příklad
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
V Data Science je běžné pracovat s velmi velkými datovými sadami.
V tomto tutoriálu se pokusíme co nejvíce usnadnit pochopení konceptů Data Science. Budeme proto pracovat s malým souborem dat, který lze snadno interpretovat.