Data Science – Co jsou data?


Co je Data?

Data jsou souhrn informací.

Jedním z účelů Data Science je strukturovat data, aby byla interpretovatelná a snadno se s nimi pracovalo.

Data lze rozdělit do dvou skupin:

  • Strukturovaná data
  • Nestrukturovaná data

Nestrukturovaná data

Nestrukturovaná data nejsou organizována. Pro účely analýzy musíme data uspořádat.

Nestrukturovaná data

Nestrukturovaná data


Strukturovaná data

Strukturovaná data jsou organizována a snáze se s nimi pracuje.

Strukturovaná data


Jak strukturovat data?

Ke strukturování nebo prezentaci dat můžeme použít pole nebo databázovou tabulku.

Příklad pole:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

Následující příklad ukazuje, jak vytvořit pole v Pythonu:

Příklad

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

V Data Science je běžné pracovat s velmi velkými datovými sadami.

V tomto tutoriálu se pokusíme co nejvíce usnadnit pochopení konceptů Data Science. Budeme proto pracovat s malým souborem dat, který lze snadno interpretovat.