Příklad 1 Data
Sběr dat TensorFlow
Data použitá v příkladu 1 jsou seznamem objektů automobilů, jako je tento:
{
"Name": "chevrolet chevelle malibu",
"Miles_per_Gallon": 18,
"Cylinders": 8,
"Displacement": 307,
"Horsepower": 130,
"Weight_in_lbs": 3504,
"Acceleration": 12,
"Year": "1970-01-01",
"Origin": "USA"
},
{
"Name": "buick skylark 320",
"Miles_per_Gallon": 15,
"Cylinders": 8,
"Displacement": 350,
"Horsepower": 165,
"Weight_in_lbs": 3693,
"Acceleration": 11.5,
"Year": "1970-01-01",
"Origin": "USA"
},
Datová sada je soubor JSON uložený na adrese:
https://storage.googleapis.com/tfjs-tutorials/carsData.json
Čištění dat
Při přípravě na strojové učení je vždy důležité:
- Odstraňte data, která nepotřebujete
- Vyčistěte data od chyb
Odebrat data
Chytrý způsob, jak odstranit nepotřebná data, extrahovat pouze data, která potřebujete .
To lze provést iterací (smyčkou) vašich dat pomocí funkce mapy .
Níže uvedená funkce vezme objekt a vrátí pouze x a y z vlastností objektu Horsepower a Miles_per_Gallon:
function extractData(obj) {
return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}
Odstraňte chyby
Většina datových sad obsahuje nějaký typ chyb.
Chytrý způsob, jak odstranit chyby, je použít funkci filtru k odfiltrování chyb.
Níže uvedený kód vrátí hodnotu false, pokud jedna z vlastností (x nebo y) obsahuje hodnotu null:
function removeErrors(obj) {
return obj.x != null && obj.y != null;
}
Načítání dat
Když máte připravené funkce mapy a filtru, můžete napsat funkci pro načtení dat.
async function runTF() {
const jsonData = await fetch("cardata.json");
let values = await jsonData.json();
values = values.map(extractData).filter(removeErrors);
}
Vykreslování dat
Zde je nějaký kód, který můžete použít k vykreslení dat:
function tfPlot(values, surface) {
tfvis.render.scatterplot(surface,
{values:values, series:['Original','Predicted']},
{xLabel:'Horsepower', yLabel:'MPG'});
}