Changeset 11


Ignore:
Timestamp:
Jun 19, 2010, 6:32:52 PM (9 years ago)
Author:
maarten
Message:

fixed latest requests

Files:
4 edited

Legend:

Unmodified
Added
Removed
  • lib/Omim2dbsnp.pm

    r10 r11  
    5252                        $dbsnp = $self->{O2P}->{$omim}->{$av};
    5353                }
    54                 else {
    55                         $dbsnp = "\t";
    56                         #carp( "omimid:" . $omim,
    57                         #       " numberref:", $av, " value does not exist/n" );
    58                 }
     54#               
    5955       
    6056
  • lib/ProccesAllicVariants.pm

    r10 r11  
    4343        my ( $title, $alt ) = @_;
    4444        my $protein = "";
    45 
     45        #print($title);
     46        #print("\n\n".$alt);
    4647        if ( $title =~ m/\;/ ) {
    4748                if ( $title =~ /([\w\-]{2,10})\s{0,1}$/ ) {
     
    6667
    6768                        else {
    68                                 if ( $titlelong =~ /[\;\:][ ]*?([\w\-]{3,10})[ ]*?\;/ ) {
     69                                if ( $titlelong =~ /[\;\:][ ]*?([\w\-]{2,10})[ ]*?\;/ ) {
    6970                                        $protein = $1;
    7071                                }
     
    7273                }
    7374        }
     75        if (length(trim( $protein))==0){
     76                if($alt =~ /\;\s([\d\w]{2,8}),\sINCLUDED/){
     77                      $protein = $1;
     78                     
     79                }
     80        }
     81
    7482        return ( trim $protein);
    7583}
    7684
    77 sub getMutation {
     85sub getAAMutation {
    7886        my $av = shift;
    7987
    8088        my $mutation = $av->aa_ori() . $av->position() . $av->aa_mut();
     89#       if ( length($mutation) == 0 ) {
     90#               $mutation =
     91#                 formatInDelMutation( $av->additional_mutations(),
     92#                       $av->description() );
     93#
     94#       }
     95        return ($mutation);
     96
     97}
     98sub getDNAMutation {
     99        my $av = shift;
     100        my $mutation ="";
     101        my $aamutation = $av->aa_ori() . $av->position() . $av->aa_mut();
    81102        if ( length($mutation) == 0 ) {
    82                 $mutation =
    83                   formatInDelMutation( $av->additional_mutations(),
    84                         $av->description() );
     103                $mutation =$av->additional_mutations();
     104#                 formatInDelMutation( $av->additional_mutations(),
     105#                       $av->description() );
    85106
    86107        }
     
    214235                        $desc =~ s/$regex7/ /i;
    215236                }
    216                 else {
    217 
    218                         $result = "\t";
    219                 }
    220 
     237               
    221238        }
    222239        if ($returnDesc==1){
     
    383400}
    384401
     402sub formatNucleotideMutation{
     403        my ($mutation,$postion)       = @_;
     404        my $formated="";
     405        #6088c-t --> 6088C>T
     406        if (length($mutation)>0){
     407          if ( $mutation =~ /([\d]+)([actg])-([actg])/i ) {
     408                  $formated=$1.$2.">".$3;
     409         
     410                 
     411          }#T-to-C transition at nucleotide 1622 in exon 12
     412          elsif($mutation =~ /([actgT])\-to\-([aCctg]).*nucleotide\s([\d]+)/i ){
     413                  $formated=$3.$1.">".$2 ;
     414                 
     415          }elsif($postion=~/^\d+$/){
     416                $formated=calculateNuclitideMutation($mutation,$postion);
     417          }
     418        }
     419        return ($formated);
     420}
     421
     422sub calculateNuclitideMutation{
     423        my ($mutation,$postion)       = @_;
     424        my $formated="";
     425         if ( $mutation =~ /[actg]{3}[-\s]to[-\s]([actg]{3})/i ) {
     426                  $formated=(($postion*3)-2)."_".($postion*3)."delins".$1;
     427         
     428          }
     429        return ($formated);
     430}
     431
     432
    385433sub getDeceaseID {
    386434        my ($text) = shift;
    387435        my $deceaseID = "";
    388436
    389         if ( $text =~ /\(([\W\;\S]{0,15}\d{6})\)/g ) {
     437        if ( $text =~ /\([\W\;\S]{0,15}(\d{6})\)/g ) {
    390438                $deceaseID = $1;
    391439
    392440                                $deceaseID =~ s/^see //i;
    393441        }
    394         else {
    395                 $deceaseID = "\t";
    396         }
     442       
    397443        return ($deceaseID);
    398444}
     
    537583
    538584        }
    539         if ( $result eq "" ) {
    540                 $result = "\t";
    541         }
     585       
    542586
    543587        return ($result);
     
    547591        my ( $self, $avsref, $refsref, $numb ) = @_;
    548592        my @avs    = @$avsref;
    549         my $result = "";
     593        my $result =   "omimrecord" . "\t"
     594                      . "av number" . "\t"
     595                  . "title" . "\t"
     596                  . "decease id" . "\t"
     597                  . "aa mutation". "\t"
     598                  . "dna mutation"."\t"
     599                  . "DBsnp" . "\t"
     600                  . "references" . "\t"
     601                  . "nucleotide mutation" . "\t"
     602                  . "formated nucleotide mutation"."\n";
     603
     604
    550605        #print(Dumper(@avs ));
    551606        #todo save $avsref so it  can be accesed lateron
     
    574629                        }
    575630
    576                         my $mutation = getMutation($av);
    577 
     631                        #my $mutation = getMutation($av);
     632                        my $aamutation=getAAMutation($av);
     633                        my $dnamutation=getDNAMutation($av);
    578634                        my $authorsAndYears = getAuthor( $av->description() );
    579635                        $authorsAndYears = formatAuthors($authorsAndYears);
     
    588644                        my $nucleotidemutation =
    589645                          extractnuclitdemutation( $desc, $av->position(),0);
     646                        my $formatedNucleotidemutation =formatNucleotideMutation($nucleotidemutation,$av->position());
    590647
    591648                        $result .=
     
    594651                          . $av->title() . "\t"
    595652                          . $deceaseID . "\t"
    596                           . $mutation . "\t"
     653                          . $aamutation . "\t"
     654                          . $dnamutation."\t"
    597655                          . $dbsnp . "\t"
    598656                          . $articles . "\t"
    599 
    600                           . $nucleotidemutation . "\n";
     657                          . $nucleotidemutation . "\t"
     658                          . $formatedNucleotidemutation."\n";
    601659
    602660                        #                       }
  • stat.sh

    r10 r11  
    33echo "Totaal aantal Allelic Variants"
    44grep -P "\n" *.txt |wc -l
    5 echo "Totaal aantal Allelic Variants zonder vedere informatie (ook ins en dels)"
     5echo "Totaal aantal Allelic Variants zonder verdere informatie (ook ins en dels)"
    66grep -P "\t\t\n" *.txt |wc -l
    77echo "Totaal aantal Allelic Variants met AA mutatie"
    88grep -P "\t[A-Z]{3}\d{1,4}[A-Z]{3}\t" *.txt |wc -l
    9 echo "Totaal aantal Allelic Variants met AA mutatie zonder vedere info"
     9echo "Totaal aantal Allelic Variants met AA mutatie zonder verdere info"
    1010grep -P "\t[A-Z]{3}\d{1,4}[A-Z]{3}\t.*\t\t\n" *.txt |wc -l
    1111echo "\n"
  • test/test.pl

    r10 r11  
    1010use Omim2dbsnp;
    1111use Bio::Phenotype::OMIM::OMIMparser;
    12 use Test::More tests =>77;
     12use Test::More tests =>81;
    1313
    1414#lib "../lib";
     
    4545is( @$years[0], "1999", "formatyears multiple" );
    4646is( @$years[1], "2000", "formatyears multiple" );
     47
     48my $formated=ProccesAllicVariants::formatNucleotideMutation("6088C-T transition","");
     49is( $formated, "6088C>T", "format 6088C-T transition" );
     50
     51
     52$formated=ProccesAllicVariants::formatNucleotideMutation("T-to-C transition at nucleotide 1622 in exon 12","");
     53is( $formated, "1622T>C", "T-to-C transition at nucleotide 1622 in exon 12" );
     54
     55$formated=ProccesAllicVariants::formatNucleotideMutation("CGA to TGA",2147);
     56is( $formated, "6439_6441delinsTGA", "CGA to TGA 2147" );
     57
     58$formated=ProccesAllicVariants::calculateNuclitideMutation("CGA to TGA","2147");
     59is( $formated, "6439_6441delinsTGA", "CGA to TGA 2147" );
     60
     61$formated=ProccesAllicVariants::calculateNuclitideMutation("CGA-to-CAA","2209");
     62is( $formated, "6625_6627delinsCAA", "CGA-to-CAA 2209" );
     63
     64
    4765my $getauthor = ProccesAllicVariants::getAuthor($string);
    4866
     67 $years=ProccesAllicVariants::fomatYears("1999 ,2000");
    4968
    5069
Note: See TracChangeset for help on using the changeset viewer.