Proiect Analiza Datelor

Description
Proiect Analiza Datelor

Please download to get full document.

View again

of 19
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Information
Category:

Documents

Publish on:

Views: 0 | Pages: 19

Extension: PDF | Download: 0

Share
Transcript
    Academia de Studii Economice Bucuresti Facultatea de Cibernetica, Statistica si Informatica Economica Proiect Analiza Datelor 1116    Cuprins   Introducere 2  Speranta De Viata La Nastere3 Femei Însărcinate Care Au Primit Îngrijire Prenatala (%)3 Rata Fertilității (Nasteri per Femeie)3 Rata Mortalității Infantile (Numărul Nou-născuților Decedati/1000 Nasteri Vii)3 Cheltuieli Personale Pentru Sănătate (% Din Totalul De Cheltuieli Private)3 Analiza Componentelor Principale 3  Deviatia Standard4 Matricea cu eigenvectors4 Variabilele Scalate5 Media5 Matricea de scoruri6 Alegerea numarului de componente principale6 Analiza Cluster 8  Metoda lui Ward8 Algoritmul celor K-medii9 Recunoasterea Supervizata a Formelor 11   Anexe 16  Datele Initiale16 Comenzi Folosite in R17 Matricea Scorurilor18 Datele Scalate20 1  Introducere Datele utilizate in analiza se refera la 41 de tari din Intreaga lume, ordonate in functie de pozitionarea ca si speranta de viata la nastere, astfel incat Romania sa se afle printre ele. Datele se caracterizeaza din prisma a 6 indicatori agregati, variabile enumerate mai jos. SPERANTA DE VIATA LA NASTERE Speranta de viata la nastere reprezinta media duratelor de viata a unei generatii imaginare care ar fi supusa intreaga sa viata ratelor de mortalitate pe grupe de varsta ale anului de observare; reprezinta numarul mediu de ani pe care o persoana il poate trai in mod obisnuit, exprimat la nastere; difera in functie de sexul persoanei. FEMEI INSARCINATE CARE AU PRIMIT INGRIJIRE PRENATALA (%) Indicatorul exprima procentul de femei Insarcinate care au beneficiat de Ingrijire medicala prenatala din partea unui personal calificat, cel putin o data, pentru motive legate de sarcina. Indicatorul este exprimat In functie de numarul total de femei Insarcinate. RATA FERTILITATII (NASTERI PE FEMEIE) Rata fertilitatii reprezinta numarul de copii nascuti de o femeie, In ipoteza ca aceasta ar trai pana la dupa varsta procrearii si daca ar avea un numar de copii relevant cu specificul varstei. RATA MORTALITATII MATERNE (NUMARUL MAMELOR DECEDATE/100000 NASTERI VII) - Rata mortalitaţii materne (MMR) este numarul anual de decese de sex feminin per 100.000 nascuţi-vii din orice cauza legate sau agravate de sarcina sau gestionarea acestuia (cu exceptia cauze accidentale sau incidentale). MMR include decese In timpul sarcinii, naşterii, sau In termen de 42 de zile de la Incetarea de sarcina, indiferent de durata şi site-ul de sarcina, pentru un anumit an. RATA MORTALITĂȚII INFANTILE (NUMĂRUL NOU-NĂSCUȚILOR DECEDATI/1000 NASTERI VII) Rata mortalității infantile reprezinta numărul de nou-născuți morți Într-o perioada de un an de la naștere, raportat la un număr de 1000 de nașteri reușite, Într-un anumit an. Cea mai importanta cauza a mortalității infantile este deshidratarea din cauza diareei. Datorita succesului in răspândirea informației despre soluțiile orale rehidratate (un amestec de săruri, zahar și apa), numărul copiilor care mor din cauza deshidratării a scăzut, ajungând pe locul doi spre sfârșitul anilor 1990. In prezent, cea mai comuna cauza a mortalitatii infantile este pneumonia. CHELTUIELI PERSONALE PENTRU SĂNĂTATE (% DIN TOTALUL DE CHELTUIELI PRIVATE) Cheltuieli personale pentru sanatate sunt orice cheltuieli directe efectuate de catre gospodariile populatiei, inclusiv gratuitati si plati In natura, la practicieni de sanatate si furnizorii de produse farmaceutice, aparate terapeutice, precum si alte bunuri si servicii al caror principal scop este 2  de a contribui la refacerea sau ameliorarea starii de sanatate a persoanelor fizice sau grupurilor de populatie. Este o parte a cheltuielilor private de sanatate. Analiza Componentelor Principale Datele multivariate sunt greu de vizualizat. Din acest motiv ar fi necesara reducerea dimensiunilor matricei lor. De cele mai multe ori este dorita reducerea numarului de coloane.Tehnica numita „Analiza componentelor principale” (Principal Component Analysis – PCA) are ca scop reducerea controlata a numarului de variabile(coloane) ale matricei de date, pe cat posibil la doua sau trei. Astfel, in loc de p variabile – corelate intre ele – am dori sa avem doar doua sau trei variabile noi, numite componente. Acestea exprima atribute noi ale indivizilor si sunt construite in aşa fel incat sa fie necorelate intre ele, fiecare dintre aceste noi variabile fiind o combinaţie liniara de variabilele srcinale. Scopul PCA este acela de a extrage cel mai mic numar de componente care sa recupereze cat mai mult din informaţia totala conţinuta in datele srcinale. Deviatia Standard > dtPca<-princomp(dt,cor=TRUE,scores=TRUE) > dtPca$sdev Comp.1   Comp.2   Comp.3   Comp.4   Comp.5   Comp.6  1.5285967 1.1638761 0.996527 0.8644083 0.5966881 0.4609557 Matricea cu eigenvectors Valori proprii şi vectori proprii sunt asociati matricei corelatiilor variabilelor initiale. O valoare proprie mai mare decat 1, pentru o componenta, indica faptul ca acea componenta are o contributie mai mare decat a unei variabile initiale, deci este indicat a fi extrasa. Vectorii proprii, asociati valorilor proprii, vor constitui ponderile in calculul combinatiilor liniare respective. > dtPca$loadings  Comp.1   Comp.2   Comp.3   Comp.4   Comp.5   Comp.6  SPERANTA.DE.VIATA.LA.NASTERE V1 -0.365 0.143 0.621 0.548 0.367 -0.161 FEMEI.INSARCINATE.CARE.AU.PRIMIT.INGRIJIRE.V2 -0.127 0.549 0.471 -0.661 -0.102 0.11 3
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks