Příklad 1 Data


Sběr dat TensorFlow

Data použitá v příkladu 1 jsou seznamem objektů automobilů, jako je tento:

{
  "Name": "chevrolet chevelle malibu",
  "Miles_per_Gallon": 18,
  "Cylinders": 8,
  "Displacement": 307,
  "Horsepower": 130,
  "Weight_in_lbs": 3504,
  "Acceleration": 12,
  "Year": "1970-01-01",
  "Origin": "USA"
},
{
  "Name": "buick skylark 320",
  "Miles_per_Gallon": 15,
  "Cylinders": 8,
  "Displacement": 350,
  "Horsepower": 165,
  "Weight_in_lbs": 3693,
  "Acceleration": 11.5,
  "Year": "1970-01-01",
  "Origin": "USA"
},

Datová sada je soubor JSON uložený na adrese:

https://storage.googleapis.com/tfjs-tutorials/carsData.json


Čištění dat

Při přípravě na strojové učení je vždy důležité:

  • Odstraňte data, která nepotřebujete
  • Vyčistěte data od chyb

Odebrat data

Chytrý způsob, jak odstranit nepotřebná data, extrahovat pouze data, která potřebujete .

To lze provést iterací (smyčkou) vašich dat pomocí funkce mapy .

Níže uvedená funkce vezme objekt a vrátí pouze x a y z vlastností objektu Horsepower a Miles_per_Gallon:

function extractData(obj) {
  return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}

Odstraňte chyby

Většina datových sad obsahuje nějaký typ chyb.

Chytrý způsob, jak odstranit chyby, je použít funkci filtru k odfiltrování chyb.

Níže uvedený kód vrátí hodnotu false, pokud jedna z vlastností (x nebo y) obsahuje hodnotu null:

function removeErrors(obj) {
  return obj.x != null && obj.y != null;
}

Načítání dat

Když máte připravené funkce mapy a filtru, můžete napsat funkci pro načtení dat.

async function runTF() {
  const jsonData = await fetch("cardata.json");
  let values = await jsonData.json();
  values = values.map(extractData).filter(removeErrors);
}


Vykreslování dat

Zde je nějaký kód, který můžete použít k vykreslení dat:

function tfPlot(values, surface) {
  tfvis.render.scatterplot(surface,
    {values:values, series:['Original','Predicted']},
    {xLabel:'Horsepower', yLabel:'MPG'});
}