Dacă lucrați cu seturi de date mai mari în Foi de calcul Google, compararea valorilor variabile poate fi un proces obositor. Din fericire, normalizarea este o metodă statistică care vă va ajuta să sortați valorile complicate în seturi de date ușor de comparat.
Acest articol va explica ce este normalizarea și cum puteți normaliza datele din Foi de calcul Google pentru beneficii statistice.
Cum se normalizează datele în Foi de calcul Google?
Să presupunem că avem câteva valori numerice în celule variind de la A2 la A50. Pentru a normaliza acest interval în valori cuprinse între X și Y, iată ce trebuie să faceți:
- Dacă primul dvs. punct de date este în A2, prima valoare normalizată poate fi găsită utilizând această formulă:
(YX) * ((A2-MIN ($ A $ 2: $ A $ 50)) / (MAX ($ A $ 2: $ A $ 50) -MIN ($ A $ 2: $ A $ 50))) + Y
Folosiți direct valorile numerice pentru X și Y.
- După ce ați introdus formula pentru primul număr, mutați cursorul mouse-ului în partea de jos a celulei până când devine o cruce. Apoi, apăsați și trageți cursorul în jos pentru a umple rândurile rămase cu formula. Foi de calcul Google va înlocui automat A2 cu numărul rândului corespunzător pentru celulele rămase, în timp ce totul din spatele simbolurilor $ nu se va schimba.
- Dacă doriți să faceți referire la valorile lui X și Y din alte celule din foi, trebuie să puneți $ s înainte de rândul și coloana celulelor în care se află valorile (de exemplu, $ D $ 5) sau copierea formulei s-ar putea să vă dea o eroare de analiză sau rezultate greșite.
- Datele dvs. vor fi acum normalizate între valorile X și Y.
Normalizarea datelor dvs. este o modalitate excelentă de a evalua diferențele dintre două seturi de date cu valori minime și maxime diferite.
Cum se folosește Foi de calcul Google ca bază de date
Fiecare bază de date este în esență un tabel mare (sau multe tabele conectate), guvernat de un sistem de gestionare a bazelor de date. Dacă lucrați cu un set de date relativ mic, care nu trebuie să scară prea mult, Foi de calcul Google poate fi utilizată ca bază de date.
cum se verifică ping în lol
Dacă doriți să începeți să folosiți Foi de calcul Google ca bază de date, va trebui să aveți un background în programarea de bază. De asemenea, veți avea nevoie de un API pentru a face foaia compatibilă cu SQL și Python. În timp ce Google oferă un API cuprinzător pentru serviciile sale, ar putea fi puțin prea mult de gestionat. Prin urmare, vă recomandăm sheet2api sau Autocodificare pentru a rezolva nevoia API. Serviciile API vor oferi conexiunea și autentificările necesare pentru a vă conecta Foi de calcul Google ca bază de date și vor oferi suficiente puncte finale pentru a permite un flux de lucru adecvat al bazei de date.
Principalul avantaj al utilizării Foi de calcul Google ca bază de date este că puteți avea întotdeauna o imagine de ansamblu vizuală a tuturor datelor. Deoarece Foi de calcul Google este disponibilă ca aplicație pentru dispozitive mobile și este compatibilă cu majoritatea browserelor și sistemelor de operare, baza de date poate fi accesată de oriunde din lume. De asemenea, puteți vizualiza și edita direct datele în foaia însăși, mai degrabă decât să utilizați codul pentru a rula o interogare prin baza de date pentru a face modificări.
Cu toate acestea, Foi de calcul Google are limitările sale în ceea ce privește gestionarea bazelor de date. În primul rând, există o lipsă distinctă a funcțiilor relaționale. Bazele de date sunt de obicei compuse din mai multe tabele care utilizează chei străine pentru a comunica între ele, un proces care pur și simplu nu există într-o singură foaie de calcul.
Dacă doriți să aruncați un exemplu, luați în considerare departamentele din compania dvs. Într-o foaie de calcul, acestea ar fi de obicei doar șiruri tipizate. Cu toate acestea, acest lucru nu este înțelept pentru un set de date mai mare. În bazele de date, veți avea un tabel separat pentru departamentele companiei, cu fiecare departament numerotat corespunzător. Apoi, ați face referire la numărul departamentului în datele despre un angajat, folosind o cheie străină. A avea un tabel de departamente separat vă permite să faceți modificări directe către departamentele în sine, fără a rula modificările prin întreaga bază de date.
În plus, Foi de calcul Google poate stoca doar cinci milioane de celule odată. Deși acest lucru ar putea părea un număr mare, chiar și companiile mijlocii pot avea baze de date care depășesc cu mult această limită. În plus, veți ajunge la probleme de performanță mult mai repede înainte de a ajunge la limita de celule. Cu o scalare aparent liniară între numărul de celule și performanță, veți avea întârzieri semnificative atunci când lucrați cu o bază de date care conține 100 de mii de celule.
Întrebări frecvente suplimentare
Puteți insera date în Foi de calcul Google?
API-ul încorporat Google vă permite să inserați un tabel direct din fișiere. Instrumentul de importare fișiere acceptă următoarele extensii:
• .xls
• .xlsx
• .xlsm
• .xlt
• .xltx
• .xltm
• .ods
• .csv
• .txt
• .tsv
• .tab
În plus, software-ul terță parte are de obicei integrări cu Foi de calcul Google. Sheets2api și Autocode, despre care am discutat anterior, ambele au soluții API pentru a furniza inserarea datelor în tabelele existente.
De asemenea, puteți utiliza funcția IMPORTRANGE pentru a insera date dintr-o foaie Google în alta.
Google are, de asemenea, instrucțiuni de scriptare pentru a scrie conținut într-o foaie de calcul.
Dacă reușiți să găsiți o soluție API care să funcționeze pentru dvs., puteți insera cu ușurință date în Foi de calcul Google după ce le-ați conectat la platforma dvs.
de ce nu va funcționa butonul de pornire pe Windows 10
Cum pot curăța datele din Foi de calcul Google?
Foi de calcul Google oferă mai multe soluții pentru curățarea și sortarea datelor.
Dacă utilizați Formulare Google pentru a colecta rezultatele sondajului, puteți configura Formulare pentru a lipi automat răspunsurile într-o foaie de calcul, în loc să lipiți manual datele.
Foi de calcul Google are și o funcție de validare a datelor. Dacă accesați Date> Validare date, puteți configura caracteristici de validare pentru a preveni valorile incorecte. De exemplu, puteți face o listă de elemente care pot fi introduse într-o anumită coloană și încercarea de a insera orice altceva va duce la o eroare.
Foi de calcul Google are, de asemenea, opțiuni Eliminați duplicatele și Opțiunile de spațiu alb. Aceasta va elimina orice valori suplimentare și spații albe din rândurile și celulele dvs.
când mi-am făcut contul Gmail
Dacă doriți să lipiți mai multe date organizate din paginile online, utilizați IMPORTHTML sau IMPORTXML pentru a obține informațiile de care aveți nevoie de pe o pagină web, fără a fi dezordine suplimentară.
Ce înseamnă normalizarea datelor?
În statistici, normalizarea datelor vă va permite să faceți seturi de date variate mai comparabile.
Când normalizați datele, puteți schimba intervalul valorii numerice originale într-un interval la alegere. De exemplu, puteți normaliza diferite metode de notare în același interval de valori pentru a le compara între ele.
Normalizarea unei valori x care provine dintr-un interval (y, z) într-un interval (a, b) se face prin următoarea formulă:
X_normalizat = (b - a) * ((x - y) / (z - y)) + a
Normalizarea datelor este utilă atunci când seturile de date originale nu au valori curate. De exemplu, standardizarea intervalelor la (0,100) poate contribui la o prezentare rapidă a scorurilor independente de valoarea maximă a scorurilor.
O metodă statistică suplimentară în evaluarea datelor este standardizarea. Acest lucru pune valorile numerice originale să aibă o medie de 0 și o abatere standard de 1. Valorile standardizate sunt adesea numite scoruri z.
Foi de calcul Google are o funcție care vă permite să standardizați un set de date. Funcția STANDARDIZE (x, medie, standard_dev) va pune valoarea numerică, x, în forma sa standardizată. Puteți utiliza funcția MEDIE (interval) pentru a obține valoarea medie a datelor din tabel și puteți utiliza funcția ST_DEV (interval) pentru a calcula abaterea standard a setului de date.
Interpretarea datelor standardizate este puțin diferită. De exemplu, un număr standardizat de -1,5 înseamnă că valoarea inițială este mai mică decât media de 1,5 ori abaterea standard a setului.
Standardizarea poate fi utilă pentru a compara valorile diferitelor seturi de date cu așteptări și mijloace diferite. Deoarece o standardizare pune întotdeauna media la 0 și o abatere la 1, valorile reale prezentate în setul de date nu vor interfera cu comparația.
Analiza statistică poate transforma, de asemenea, un set de date pentru a se potrivi unei anumite distribuții, dar aceasta este o caracteristică statistică avansată care nu va fi acoperită în acest ghid.
Nou Normal
Normalizarea seturilor de date este un instrument incredibil de util în analiza datelor, iar Foi de calcul Google oferă o soluție rapidă pentru normalizarea datelor numerice. În plus, puteți utiliza Foi de calcul Google ca o bază de date mică, dacă nu lucrați cu cantități extraordinare de seturi de date pentru munca dvs. Integrările cu Foi de calcul Google cu software-ul terților îl fac potrivit pentru o gamă largă de industrii. Cu toate acestea, bazele de date adecvate vor fi mult mai scalabile.
Ce tip de informații normalizați de obicei în Foi de calcul Google? Folosiți Foi de calcul Google pentru baza dvs. de date? Spuneți-ne în secțiunea de comentarii de mai jos.