Changeset 8


Ignore:
Timestamp:
Apr 19, 2010, 7:18:26 PM (9 years ago)
Author:
maarten
Message:

removed some output bugs

Files:
4 edited

Legend:

Unmodified
Added
Removed
  • getFIles.sh

    r6 r8  
    11cd data
     2rm omim.txt
     3rm pubmed_cited
     4rm omim.txt
    25wget ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606/database/organism_data/OmimVarLocusIdSNP.bcp.gz
    3 gzip -xvf OmimVarLocusIdSNP.bcp.gz
    4 cut -f "1 3 9" OmimVarLocusIdSNP.bcp |grep -P "\t\d{4}\t"< dbsnp-to-OMIM.cvs
     6gzip -dc OmimVarLocusIdSNP.bcp.gz |cut -f "1 3 9"  |grep -P "\t\d{4}\t"> dbsnp-to-OMIM.cvs
     7rm OmimVarLocusIdSNP.bcp.gz
    58
    6 wget ftp://ncbi.nlm.nih.gov/repository/OMIM/omim.txt.Z
     9wget ftp://ftp.ncbi.nlm.nih.gov/repository/OMIM/omim.txt.Z
    710uncompress omim.txt.Z
    811
     12wget ftp://ftp.ncbi.nlm.nih.gov/repository/OMIM/pubmed_cited
  • lib/Omim2Pubmed.pm

    r7 r8  
    4141                }
    4242                else {
    43                         $pubmed = "non found";
     43                        $pubmed = "";
    4444                        #carp( "omimid:" . $omim,
    4545                                #" numberref:", $ref, " value does not exist/n" );
  • lib/ProccesAllicVariants.pm

    r7 r8  
    188188
    189189                my @refs    = @$refsref;
    190                 my $counter = 0;
     190                my $counter = 1;
    191191                foreach my $ref (@refs) {
    192                         $counter = $counter + 1;
    193192                        my $auth = $ref->authors();
    194193                        if ( $auth =~ m/^$authAV/ ) {
    195194                                my $authY = $ref->location();
     195                                my $tempresult="";
    196196                                if ( $authY =~ m/$yearAV/ ) {
    197 
    198                                         $result .=
     197                                       
     198                                        $tempresult =
    199199                                          $self->{Omim2Pubmed}->getpubmed( $numb, $counter );
     200                                          if ($tempresult ne ""){
     201                                                print($counter." ".$numb."\n");
     202                                                $result.=$tempresult;
     203                                          }else{
     204                                                $result.=$authAV."(".$yearAV.") ".$ref->location();
     205                                               
     206                                          }
    200207                                }
    201208                        }
     209                        $counter = $counter + 1;
    202210                }
    203211        }
     
    269277sub formatInDelMutation{
    270278                my $mutation = shift;
    271                 print("'".$mutation."'");
     279#               print("'".$mutation."'");
    272280                my $formatMutation="";
    273281                if  ( $mutation =~ /^1-BP\s*?(DEL)\,\s*?(\d{1,5})([A-Z])/i ) {
     
    283291                }elsif($mutation =~ /^(\d{1,5})([A-Z]*?)\s*?(DEL)/i){
    284292                        $formatMutation=$1.lc($3).$2;
    285                 }else{
     293                }elsif($mutation =~/(INT(\d{0,3})-(\d{0,3}) (DEL))/i){
     294               
     295                        $formatMutation="IVS".$2."+?_IVS".$3."+?".lc($4);
     296                        $mutation =~ s/INT\d{0,3}-\d{0,3} DEL//;
     297                        if(length($mutation)>5){
     298                                $formatMutation.=",".formatInDelMutation($mutation);
     299                        }
     300                }
     301                else{
    286302                        $formatMutation=$mutation;
    287303                }
     
    300316                $year     = $authAndYear[ $i + 1 ];
    301317                $pubmedid = $self->getPubmedID( $refsref, $author, $year, $numb );
    302                 $result .= "{PMID" . $pubmedid . ": " . $author . " (" . $year . ")}";
     318                $result .= "{PMID" . $pubmedid . ":" . $author . " (" . $year . ")}";
    303319        }
    304320
     
    308324sub proccesAllicVariants {
    309325        my ( $self, $avsref, $refsref, $numb ) = @_;
    310 
    311326        my @avs    = @$avsref;
    312327        my $result = "";
    313328        foreach my $av (@avs) {
    314329#print($av->number() . "\t");
     330if ($av->title() ne "REMOVED FROM DATABASE"){
    315331                my $mutation        = getMutation( $av );
    316332               
     
    319335                my $articles =
    320336                  $self->createAuthorsOutput( $refsref, $authorsAndYears, $numb );
    321                  
     337       
    322338                #lool up allelic variant in dbsnp and return accesionnumber 
    323339                my $dbsnp = $self->{Omim2DBsnp}->getdbsnp( $numb, $av->number() );
    324340                               
    325341                #print(Dumper($authorsAndYears));
    326                
    327342               
    328343                my $desc = $av->description();
     
    361376                          . $nucleotidemutation . "\n";
    362377                }
    363 
     378}
    364379        }
    365380
  • test/test.pl

    r7 r8  
    1010use Omim2dbsnp;
    1111use Bio::Phenotype::OMIM::OMIMparser;
    12 use Test::More tests => 57;
     12use Test::More tests => 62;
    1313
    1414#lib "../lib";
     
    197197
    198198is(
    199         ProccesAllicVariants::extractnuclitdemutation("on on 1 chromosome in the proband was a T-to-C transition predicted to result in a cys1417-to-arg substitution.The mutation was located in exon 30"),"T-to-C transition in exon 30","T-to-C transition BLABLA in exon 30");
     199        ProccesAllicVariants::extractnuclitdemutation("on on 1 chromosome in the proband was a T-to-C transition predicted to result in a cys1417-to-arg substitution.The mutation was located in exon 30","10"),"T-to-C transition in exon 30","T-to-C transition BLABLA in exon 30");
    200200#acta .00010
    201201$string = "In 5 affected members spanning 3 generations of a Chinese family with
     
    258258        "110-BP INS/14-BP DEL"
    259259);
    260 
     260is(
     261        ProccesAllicVariants::formatInDelMutation( "INT12-14 DEL") ,
     262        "IVS12+?_IVS14+?del",
     263        "IVS12+?_IVS14+?del"
     264);
     265
     266is(
     267        ProccesAllicVariants::formatInDelMutation( "INT12-14 DEL, INT16-31 DEL") ,
     268        "IVS12+?_IVS14+?del,IVS16+?_IVS31+?del",
     269        "IVS12+?_IVS14+?del,IVS16+?_IVS31+?del"
     270);
    261271#BRCA1.0033: 5-BP INS, NT3171. Als de nucleotiden in de tekst gespecificeerd worden, zouden we die graag terug zien, bijv. 3171_3172insAGTCG.
    262272is(
     
    296306        #               $self->createAuthorsOutput( $refsref,$authorsAndYears, $numb  );
    297307         $authandyear=["Ilkovski", "2001"];
    298 is($PAV->createAuthorsOutput( \@refs, $authandyear, $numb ),"{PMID11333380: Ilkovski (2001)}","testing layout of authors");
    299 
     308is($PAV->createAuthorsOutput( \@refs, $authandyear, $numb ),"{PMID11333380:Ilkovski (2001)}","testing layout of authors");
     309#grep -P -B 2 -A 3718 "313700$" data/omim.txt > test/data.bak/AR.txt
     310 $filename    = "data.bak/AR.txt";
     311
     312 $omim_parser =
     313  Bio::Phenotype::OMIM::OMIMparser->new( -omimtext => $filename );
     314 $PAV = ProccesAllicVariants->new();
     315$PAV->addOmim2pubmed($omim2pubmed);
     316$PAV->addOmim2dbsnp($dbsnp);
     317
     318 $omim_entry = $omim_parser->next_phenotype();
     319 $numb       = $omim_entry->MIM_number();
     320 @refs       = $omim_entry->each_Reference();    # *FIELD* RF
     321
     322@avs = $omim_entry->each_AllelicVariant();
     323
     324print(Dumper(@refs));
     325is( ( $PAV->getPubmedID( \@refs, "Pitteloud", "2004", $numb ) ),
     326        "Pitteloud(2004) J. Clin. Endocr. Metab. 89 1053-1058 (2004)", "get omim record without omim number " );
     327       
     328
     329is( ( $PAV->getPubmedID( \@refs, "Brown", "1989", $numb ) ),
     330        "2563196", "get omim record Brown " );
     331               
     332is( ( $PAV->getPubmedID( \@refs, "Lumbroso", "1996", $numb ) ),
     333        "8626869", "get omim record Lumbroso 100" );
     334       
     335        is( ( $PAV->getPubmedID( \@refs, "McPhaul", "1991", $numb ) ),
     336        "2010552", "get omim record  McPhaul 112" );
     337       
     338                is( ( $PAV->getPubmedID( \@refs, "Migeon", "1981", $numb ) ),
     339        "6947233", "get omim record Migeon 120" );
     340       
     341                is( ( $PAV->getPubmedID( \@refs, "Mononen", "2000", $numb ) ),
     342        "11103816", "get omim record  Mononen 123" );
     343       
     344                        is( ( $PAV->getPubmedID( \@refs, "Montie", "2009", $numb ) ),
     345        "19279159", "get omim record  Montie 124" );
     346       
     347#                               is( ( $PAV->getPubmedID( \@refs, "", "", $numb ) ),
     348#       "", "get omim record  " );
     349       
     350is( ( $PAV->getPubmedID( \@refs, "Mooney", "2003", $numb ) ),
     351        "12682377", "get omim record Mooney " );
     352       
     353is( ( $PAV->getPubmedID( \@refs, "Trifiro", "1989", $numb ) ),
     354        "Trifiro (1989) (Abstract) Am. J. Hum. Genet. 45 (suppl.): A225, 1989", "get omim record whitout PMID" );
     355                       
     356       
     357         $filename    = "data.bak/ABCA4.txt";
     358
     359 $omim_parser =
     360  Bio::Phenotype::OMIM::OMIMparser->new( -omimtext => $filename );
     361 $PAV = ProccesAllicVariants->new();
     362$PAV->addOmim2pubmed($omim2pubmed);
     363$PAV->addOmim2dbsnp($dbsnp);
     364
     365 $omim_entry = $omim_parser->next_phenotype();
     366 $numb       = $omim_entry->MIM_number();
     367 @refs       = $omim_entry->each_Reference();    # *FIELD* RF
     368
     369@avs = $omim_entry->each_AllelicVariant();
     370
     371is( ( $PAV->getPubmedID( \@refs, "Allikmets", "1997", $numb ) ),
     372        "Pitteloud(2004) J. Clin. Endocr. Metab. 89 1053-1058 (2004)", "get omim record without omim number " );
Note: See TracChangeset for help on using the changeset viewer.