Profilo di Lucaccino

Nome Lucaccino
Indirizzo email n/a
Messaggi1
  • Seleziona righe da un file csv in base ad un valore contenuto in una colonna
    Forum >> Programmazione Python >> Files e Directory
    Ciao a tutti, mi sono appena iscritto al forum
    Mi sto da un po’ di tempo interessando a Python e anche se molto lentamente riesco a fare qualche piccolo progresso, pur essendo agli inizi ed avendo ancora molto da imparare a riguardo.
    Ho questo problema:
    ho un certo numero files csv ognuno relativo ad un individuo contenente dati genetici
    Da ognuno di questi vorrei estrapolare i dati contenenti ad esempio quelli con la colonna Chr = Y
    Sono riuscito a fare questa cosa, ma solo per un unico file alla volta

    Questo è il codice che ho scritto

    import pandas as pd
    df = pd.read_csv('Ind1.csv')
    print df
    df1 = df[df['Chr']=='Y']
    df1.to_csv('NewInd1.csv', sep=',', decimal='.', index=False)

    questo è il file di input usato (in formato csv)

    SNP,Chr,Allele1,Allele2
    SNP01,Y,A,A
    SNP02,Y,B,B
    SNP03,X,C,C
    SNP04,mt,D,D
    SNP05,mt,E,E

    e questo il file di output risultante

    SNP,Chr,Allele1,Allele2
    SNP01,Y,A,A
    SNP02,Y,B,B

    questo è solo un piccolo esempio, la lunghezza di ciascun file supera le 100000 righe e di questi ne ho diversi, quindi l'ideale sarebbe analizzare i files contenuti in una directory e salvarli in una seconda

    ringrazio in anticipo chi può darmi una mano
    allego dei files di esempio


    --- Ultima modifica di Lucaccino in data 2017-11-09 13:56:59 ---