Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Cigar issue with no M or N between two I's remains in minimap2 v2.26 #1090

Open
mebbert opened this issue Jul 26, 2023 · 9 comments
Open

Cigar issue with no M or N between two I's remains in minimap2 v2.26 #1090

mebbert opened this issue Jul 26, 2023 · 9 comments

Comments

@mebbert
Copy link

mebbert commented Jul 26, 2023

Hello,

I posted on issue #392 to try to reopen it since the problem remains in minimap2 v2.26, but the issue remains closed, so I'm opening a new issue.

Here's what we're seeing:

I doubt the reference would affect this, but we're currently getting it when aligning to CHM13. It's only happening on a single sample.

See below for stack trace. This is coming from a tool we use to identify dark regions, but it's built on htsjdk. We'd really like to avoid lowering the validation stringency.

Happy to provide any files that would help debug. We're aligning one of the PacBio 1KG samples (NA19384) to CHM13

htsjdk.samtools.SAMFormatException: SAM validation error: WARNING::ADJACENT_INDEL_IN_CIGAR:Read name m64119_210621_120219/71828434/ccs, No M or N operator between pair of I operators in CIGAR
    at htsjdk.samtools.SAMUtils.processValidationErrors(SAMUtils.java:458)
    at htsjdk.samtools.BAMRecord.getCigar(BAMRecord.java:284)
    at htsjdk.samtools.SAMRecord.isValid(SAMRecord.java:2234)
    at htsjdk.samtools.BAMFileReader$BAMFileIterator.advance(BAMFileReader.java:848)
    at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:834)
    at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:802)
    at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.advance(BAMFileReader.java:1058)
    at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.next(BAMFileReader.java:1048)
    at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.next(BAMFileReader.java:1012)
    at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:591)
    at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:570)
    at htsjdk.samtools.util.PeekableIterator.advance(PeekableIterator.java:71)
    at htsjdk.samtools.util.PeekableIterator.next(PeekableIterator.java:57)
    at htsjdk.samtools.filter.FilteringSamIterator.getNextRecord(FilteringSamIterator.java:135)
    at htsjdk.samtools.filter.FilteringSamIterator.next(FilteringSamIterator.java:108)
    at htsjdk.samtools.filter.FilteringSamIterator.next(FilteringSamIterator.java:46)
    at htsjdk.samtools.util.PeekableIterator.advance(PeekableIterator.java:71)
    at htsjdk.samtools.util.PeekableIterator.next(PeekableIterator.java:57)
    at htsjdk.samtools.util.AbstractLocusIterator.next(AbstractLocusIterator.java:312)
    at htsjdk.samtools.util.AbstractLocusIterator.hasNext(AbstractLocusIterator.java:234)
    at ebbertLab.drf.DarkRegionFinder.startWalkingByLocus(DarkRegionFinder.java:170)
    at ebbertLab.drf.DarkRegionFinderEngine.findDarkRegions(DarkRegionFinderEngine.java:308)
    at ebbertLab.drf.DarkRegionFinderEngine.main(DarkRegionFinderEngine.java:43)

Here's the command used to run minimap2:

minimap2 -a -t 20 -x map-pb -O 5,56 -E 4,1 -B 5 -z 400,50 -r 2k --eqx --secondary=no -L -Y -R @RG\tID:${TMP_DIR}\tSM:PacBio /path/to/reference/GRCh38_full_analysis_set_plus_decoy_hla.fa ./NA19384_20210630_Lee_m64119_210621_12021.ccs.fastq.gz ./NA19384_20210630_Lee_m64119_210620_030317.ccs.fastq.gz ./NA19384_20210622_Lee_m64119_210614_074737.ccs.fastq.gz

Can you help?

Thanks!

@lh3
Copy link
Owner

lh3 commented Jul 26, 2023

Could you give me some example sequences? Thanks!

@mebbert
Copy link
Author

mebbert commented Jul 26, 2023

Of course. I also added the minimap2 command used to align the sample to the original post.

Here's the offending read from the error above. I was surprised that I don't actually see two adjacent I in the cigar string. I do see adjacent I and D, though.

m64119_210621_120219/71828434/ccs	16	chr2	6229428	60	1782=1X44=1X63=1D1043=2X150=1X662=1X32=1X349=1X1822=1X2024=2X69=1X96=1X27=1X408=1X107=1X32=1X8=1X179=1X29=3I3D31=1X31=1X31=1X31=1X63=1X290=32D558=	*	0	0	TGTTTCATTTGTTCTTTTGTTATTGTACTGTTACTATTTTTAGTACAATGTTGACTAGAAGTGATGATGTGAGTTAAAAAATGGAGAAGCCAATCCTCAAATTCACATGACATTGTAAGAGATCCTGAATAGCCAAAATAATCTTGAAAAAGAACAAACTTGGAGGACTCACACTACCCAATCTCAAAACTTACTACAAAGTTACAGTAACAAAGTCTATGCGGTGCTGACAGATGGATACTCACAGTTCAGTGTATTAGAATCGAAGGTGCAGAGATGAAAACACAGAACAATTGTCAACTGCTTGTTGGTGTGGGCACCAAGACATTCAATGGGGACAGAATGCCCTTTATAAAATGATACTGGAGCAATTACATAGCCACATACAAAGAATGAAGTTGGACACCTTCCTCATACAAATACAAAAATTAACACAAAATAGATGAAAAACCTAAATATAAGAGCAAAACCTTAGGAGAAAACGGTGGGTAATCTTCATGACCTAGGATTTGGCAAAGACTTTTAGGATGTGACACCAAAGGCATGAAAACAACAAAAATAGATAAATTGGACTTCATCAAAATATAAAGCTTTTATGCTTCAAAGGACGCCATCAAGAACATTGAAAAAAAAAACCTTACAACTCACAGAATGGGATAAAATATCTGCAAATTACATATCTAATAAGCATCTAGTATCCAGAATAATAAGGAACTCTTACAACAAAGCAATAAAAAGACAAATACCCAATTAGAAATGGGCAAAGGATTAGAGTAATAGTGTCTCAAAAGAAGATACACAAATGGCCAACAGCCATGTAAAACTATGCTCAACACCATCAGTCATTAGGGACACGCACATCAAAGCCATAATTAAATTCCACCTACACACAAAGGTGGCTGAAATTGAAAAGGGGGACAATAACAAGTGCTGGCAATAACATGAAGAAATTAGTACCCGTGTCCATTCCTGGTGGGAGAGGAAACAGTGTAGCCACTTTGGAAATGTTTGGTAGCACTTCAAAAAATCGAACGTATTTTACTGAGCAGCTCCCTTCCTTGGTATGAACTCAAAAGATTTGAAAACGTATGTTCTTCCCAAACCTTAGTCATAAATGTTCACAGCAGTGTTATCTATATAAACAAAAGATGGAAACAATGCACACTCGCATCAGCTGATGAATGAAATAACATAGATGGTGAAACAGTAAAATAGAATACTAATTAGCCATAAAAGGAGCAATGTTCTGATAAATACTACAATGCAGGTGCAAACAGGGTGCTAAGTGAAAGAAGCCAGACACAGAAGGTTGTATATCATATGATTCCACGTATATTAAATTTCCAGTATAGCTGAATCTATAGAGAAAGAAAGTGGATTAGGGTTTGCCAGGAGCTGAGAGGAAGGGCAAATCCTTGCTAATAGGATCATTGGCAAGGGTAGAATGATTGCTAATAGGTAGAAAGTGTATTTTTGTGTTGAGAAAATATCCTGGAAATAGTAGTGATGGTTGCACAACTTTGTTGTTATAATACAAAATATCAAATTGTTTGATTTAAAATGGTGAGTTTCGTGGCATATAAATTATATGTCAATAAAAATGTAACTTTGGCCGGGCACGGTGGCTCACGCCTGTAATCCAGAACTTTGGGAGGCCGAGGCACATGGATCATGTGAGGTTAGGAGTTCGAGACCAGCCTGGCCAACATGGCAAAACCCTGTCTCTACTAAGAATACACAAAATTGGTCTGGTGTGGTAGCTGGCGCCTGTAATTCCAACTACTTGGGAGGCTGAGGCAGGAGAATTGCTTGAACCCAGGAGACAGAAGTTGCAGTGAGCCGAGATTGCGCTATTGCACCACTCCAGCCTGGGTGACAGAGCAAGACTGTCAAAAAAAAAGTTATCTTTAATGTTCACTGACTAACACTCCCAAGACTGGCATTCCTGCGCTGTGGGTATCGTTCCTGCACAAGTGACTCAGAGGATGCATTGTTTTCCCATCTGTGGCTCTGAACTCTCTTTGGTCATCAAAATTGTTTATGTCCAGCTAGTTGAAGAGGAAGATTGTGAAGGAAAAAATATCAATTCTCTAAAAAAAAAAATCCTTCCTTTTGAAGCAAACTACATCATACCTCTTCGTAAGATGGAATTTCACGGCAATGCCTATATGAGACAGGTGCTAGATGATGTATTTCCTTACTGGGAAGGTACTTCTCAGTGATAATTGGTTATTGTTTGGACAGGGGATTTATGAGCTAAATTGTGCTTCCCCCAGATTCTGTATGTTGAAGCCTTAGCATAGAGTACATCAGAATGCAACTGCCTTTAAAGATTGGGCCATTGAAAAGGTGACTAAGACTCAATCTGACTGGAAGTGGCAAGACCCAAGGGAACATGCCCATCCATGGAGGAGAGGCCAGGTGAGAACACAGCAAGAGGGTGAGTGGCTTCAAGCCACAGCAAGAGGCCTGGAGAGAGACTGCACCTGCTGATAACCTGATCTTGAACTTCCAGCCTCCAGCATGGTGAGACAAATAATTTTTTTAAACCACCTGATCAGTGCTTCTTTGTTATTGAAAGCCCTAGCAAAGTAATACAAATGGAGGGATGCAATTTGGCATACATTTATTCACTTCTGTCACACTCCACGTTCTGCTGACCTGTAAGCTAAAGGAAAATGTGTCTGTCCCCCTCATCAATGGTGGAAGAGCTACAGGAAAAACAAAATAAAATCCCTTCACCCCATTTATAAAATGGAAGAAGAGGAAACACAGCAACAACCCATCCCTAGCAGTTTGGGCAGCTGCCCTCATCCTAGCAGTAGGGGAACTTTCTCAATTATGTCCTCATTCTGCTTCCTTGCAGTGACTCTCTCGCCTCCTTTCCTCTGTGCTCTCTGGGAGATTGTCTTCTATGATCATATCCACAGCAGGCATCTGGGAGCTTACCCTTCTTCGGGTTTGCACAAATTTCACAGGCAACTTCACACTGGCGGGATTTGGGAGAGTGAAAGGGTGATTTTACTGTCAAAGATTCTTAAGCCTACAGTAATAGTTTCTTTGGAAATAAAATTTTCTAAGAAATAGGTAGGCTTTTAATCTACTTGACGCTAGTTAGTTCCATGTGTCAGTATTTAAAGTTTATTACGAGACTGGGTTCTCACACCTGCTTTACATTTGCCCCTTCTTTGCCTAAGCTGATCTCTTCCACACTAATGGTGGCTACCTTTGAGACTGTTGAAAAAATAGGCTTAGGAAGGAGCTATCTTTCTGAACCTAACATTTGCTTATTTATTGAGTCCTTCTGTTGAACTACAGTTTTTAAGTTTTTGTCTTGTTTTAGTTACTCAAAATCATTTTGAATTTAATCCCTTTCTTTCTAGTGTCTGGAAGTTCTTGCCTCTTCTCACCCTTCAAAGCTCCATATCTTGACTTTCTACTTGCTTCTGTTTCTAACGAGTGATTCTTATCCAAATTCACCCATATTATAATATCTTGGTGCTCTCTGCAAGCGAAAGAGAACTCAAAGTAACACTCTGGTCCTTCCTGGCCACTTCCCTTAGAGTGGTGTGAATTTTTGTGGACATTCAACTCTGCTGCCACAGACACAAAATCCCAAACTGAAGAACAGCAATAACTAGGGTTCCTCTGCAAAAGAAAGAGGCTTAATTGACTCATAGTTCAGCAGAGCTGGAGGGGGAGGCCTCAGGGAAGTTACAGTCATGGCAGAAGGCAAAGGAGAAGCAGGCGTCTTCTTCTCAGGGTGGCAGGACTGAGTGAGTTCAAGCAGGGGAAATGCCAGAAGTTTATAAAACCATCAGATCTCATGAGACTCACTCACTAGCATGAGTACAGCATGGGGGAACTGCCCCCATGATCAATTACCTCCACCTGGTCCTGCCTTTGACACATGGGGATGACAACAAGTCAAGATGAGATTTGGGTGGGGACACATAGCCAAACCATATCAATGTGTATATATTTCTGTATTTAAAATATACTTACATGTGATAATAAATAATATATTTATATTTATCATATATTTTATACATATAAAATATACATTTATATACATACACATATACATAGATGTGTGGATATGACTGTGTGTATATGTGTGTACTATATTTCCTCAAAATACTTATCATTGAGTAGATAAATCATTTTTTTTTCAATGATACAACTGAATAGCCATAACAAGGAACAGAGAATTCAGATTCAGGAACAAAATGTAAACAGCATGTTCATAGAGTGTGAGACATTGAGAGTTTCTCATTGCAGGACTTGCAGCCAGTTTTTCTGAATCTGTGTCCACTTCTCTTTTCACTATCACGTATTGAGCTTAGAGCCAGCCCAGCAAGCAGAGAAAGTACAACATGGACTTTCCACAAGCACAGGTTTCCAAGAGTGATTTCCTCCAGGACTACTAACAAGGAAGAGAAATTTCTGAAGCCCTCAGTCCTGAATTTGGAGAGCTCTACCCCTGCAAGAAAATGCCTGTTAACATAGCTCTGCTGGGTATAAAAAGAATTTTATTTTGGATGGCAGTTGGCTATTTTATTCCCTGAATCCTCAGTCTGACTCTATTTCATGGGGTGTCGACTCTGTCTGTGATTACTCCAATGTTCAGGTGCAGAGAAGTCAATGTTTATGAAAGTGATGTCCCTGTCAGTAGCAAGCATATCATCTGGCCCCCCGAGCTGTCAAAGAACAGATTGTAGAATTACCATTAGAATACAGGAGTTTATAGCTGCAGGCAGTAAGTGCAGAGCCGGTAAGCATATGTCCCCAGCATGATATTTTAGCTTCATATGAAGCCGTAAAGTGGAAATAAGCCAACAGTACAGCAGCAACTGCTAACTGTTCTGTCTCTCCATGTTTCCACATTGTGCCATATGTCTGGGTAATTCTCAGTAAAGGGGGCATTACTGTCTCTCAGCTGACTGAGAACATTTCCCAAAAGGGCTCAAAAAATTGGTGCGAGACTATGGTCACAATGACCTCACCTACTTTTATTGTCCAGCTGGCCTCATGGATTTTTCATTTAACTCTGGTAGAGACGTGGATCCTCTCTCAGCATTGATTAATTATGGTGAGAAAGTGAAAACTTTCTTAGAGTGAAAAAAAAAGTTCTTGAGTCTTCCAGATGTCCGTGTCTAGATGGTTAATATTTGCTCCAAAGGTTGAATAGGATTTTATAAAAGGAAAGCAAGAGATCTTTACATTATTCTTGAAGTGATATCAGTTTTTTTAAAATACAAAAATAACTAATTAATGCTAGCCTAATTAGCATCCAAAAATATGAACCATACATTATTTCAGGAAAGACAAAACTGCCTCCTGTGGATCCAAATCAGGAGGGATTCTATGCAGTTGGAAGAAGAGAGGCTTTGGAATGAGGGATATGGATTCTGTTTTCCACTTTGCCAGTTATAAACCGTGACCTTCATCAAGAGTTCAAACTCCTAGAGTCTTTGCTTTCTCAAGTGTAAAGAGATGCTAGTAAGTTGCAGGGGTGTGCATACATTTTCCCAAGGAGCTCATAAGAAGTGCCTATCACGATGAATTTCACACAACAGGGACCCCATACATGTTAGTGACCGTCCTGCTCAGCTCTGGATGAAGTCAGATTTAATCTTAAGATTGGAGAATAAGGCAGAGACTATTATCTCAATTTATGAGTCAAAAAACTGAATTTCAAAGAGATTAATTAAACTTCTCCATATTTTATTTTAGAGGAAAATGCTTAGACTTAAACCCAGGACCCTATAATTTCAAATCCCATGCTAATTTCACTACGACATGATGCCTTGTGAAAATAATGAAGCAAATTCTCTTTCCTATGAACTAAAGTTTTCAGTACTAAAAGTTTCATAGTTCTTGTATTCCACACATTTTTGAACTGATATTTATTTTTGGCAGTATGACCCATGCATATGCCTAGTATATGATTTCTGTAATTTTTATCAATGACATATTCATCTAAAATTATGACAGCTAAAGGTATTTATGTAAACTACACAAATAAATGTGATATTCATAGGGCTTTCCTTGGAATCATAAACTATAAGGAATTAATGACATGAGTGTTAGTACTGAGCTGCACCAGCCCCTCTGTTTAGCAGGACTAAACTATATTAGCCGAATGCTCCACCTGTGTGTAAAAATATCTTTCAATGGGCATCACTTTAAAAACAGATGCTATTTTGTGAAACAATCTCATATAAAACCTCAATACAGTTAATATCTTTCAGAACTGTCTAAATGTCTTTTATTAAAAATGCATTCCTGGCCTCTCTGAGTCCATGTGCTCATCTGTTGGAATGCAAATGAACACTTCTACTGTTGTAGAGTTCTTTATCTGTCACACAGACCCATGTGCCATCCACAGCCTCCCCACTCCCATGAAGGCAGGTGGTTTCTGTGTCCAGATTCAGCCAATGGGCTTTGAGTGGAAGTAAAGTGTGTCACCTCCATGTAGATGTTCAACAAAAAGTAGCTTAATAACAATGCTAATAACCGTACAATAACATTAACAGTGGTATGTATTAATTTCCAATCAGATCTTGATTTACTTTTCCTGGTATCTGATTGGCTTATAGAGACTTTTGCCACAGTGTTCTTTCTACTTTTCCTACCTTCAGTTTTCTTCATCCTTCCTTTATGCTTTTCAAAAAAAATTTCTTTCATCTAAAGCATGTTTGTTTACATTTAAGGCCCCTCTCAACGTGACCCTAACTACTGCTCCAGAATCATGGATTTTCTTAGTTCTCAATCTTACCAATGAATATTCATTTCCTGTTATATACATCAGCCACCTGGATTCCTGATCTTTTCTGAACAGCAGTGGCTTTTGCACAACGTCACACCTTTGCAAATTGTGTTATCCTCACTGAAGCGTCCTTGACATGTCCTCACAGTCACCAGATCTGAGAGCCTGACTCCGAGGGCTCTCTGGGGTCTGTGATTTGTTCTGCTGGATGATGGCACCCACAGGGTTCCGTCTGAGACACAGGTCAGAAGTGCACTCTCCCGGAATGCGTAGACTAAGTTACAGCAAAAGTAAACAGTACTGAAGCAGCTCAAGAGGGCATCTAATTGAATTATGCCAATGATTAAGTGCTCTAAATATCTATTCAATCATCTTGCCTCTACCCAGATGAGATAAAAGAATCAAGCAGGAATTATTAGAAAGGAAGAAAAATAAACTCACACTACAAATGCTGGGAGAAACTTTTTGATAGAGAAGCATAAATGAATGAAATGTCCCCCAAGAAGGCAGAGGAGCAGCACAGAAATCAAATCAGGTGGTGCTGGGCCACGATGGAAGAGAACTGGGTCAGGGAGGGAGGCCCCTGGTGTGTCACTCACCTCTCACCCTCCACTTAGCACCTCATGTCCAGAGGAGAGTGCTGTCTGCAGTCACGTCCTTCAATCTGCACATTTATTTTGGGTCTAAAGTCGATGCTTCTTTATTTCCTTTTTGTCTTTCACGTTGAGATTTTCCTCCTGTATCTCTTTGGATTGATACTGTTGGGGTAGTACAAAAAAATGCAGACTTTCCTGGTTAGGCCAGCCTTGGTTCCAATCCAGCTCAGTCCTTTTTAGCTTGTGGTCTTGGAAGGGTTACTTTGTCTTTCAATCCTCTGCAGCTTGGAGACTGGAATCCCAATCACAAAATGCTGCTTATTTATTTATTCAATTGATTATTTGCTCATTCAAGTAGTTGAGCTCTGATTGTCTGACAAACCTTGGGCTAGTTGCTAGGATTGAGACAATGGGCAAAATGTCAAGACCCTTCTCCTGGGATCTTCCAGTCCAGTGGAGCATGAAATAAAATCATGTGTAGGCAATGTCCACCTCAGTGCCTGGAATATAGTAAGTGCTCAGTAAACGGGACAGTGGCTCCTGTCCTCTTTCTTTTCTTATCCTTCTCACACACTCTTCTGTGCCTCTGTCCTCCAGCCCCCCCAGGGATTCTGACAACAAAGGTTTCTAATTTCTTTCCCAGCTTAGAGTATTGAGACAAGATTTGGATGAGCAGCCAAACGGAGAATTTCTCCTGGGAAACTTCAGCAACTTGATGCAGCTGCTGAGCAGAGGCCTCATTTTACGGGACCTCGTTGTCATCCCATGCACTGCATCAGCAGCGATTCAGAGCCTCGCTGGAAGGAGCGACAGGACAAAGGAAAAGACAGGGTTCGCACAACACAGAAGCAACGATATCCCCAGAAAATAAACCAACAAAACTAAACCCCAAAACCTCCCTTCCATTAACAGAGCCACTTAGAATATTAAAGGTTTATACGTCAAATGGCATCTTTTGATCCCTACAAGACAAAGATGTTACTTTTATGATCCCCACTTTACAAGATGTGGCTCAGAGAGGATGAGAATTTATCCAACTGGTTCAGTCAAGGTTTATTTTGCTTTCTTTCCTAAAAAAAAAAAATCCTGCAATAGACACTAACTATGGCTGGTTTAAGCAGAAGATAAGCTGATTGAAAGGACATCAGTCCATCACAGAACTGTCAGGTGGCCCAAACCAGCAGTGTCAAGGTTACGCATTAAGAATCAAACCCCTACCCACGCCCCACTACGGGAAGCAGATGCCCACCTCCTGCCCCACAGTGGGCACTACTGGAGCGTATGTAGCAGGACCATGACCTCAAGGGAACTGCTACCTCCACCGCCACAGTGAACAGTGAGACTGTACCTCCACCGCCACAGTGAACAGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACTTCCACTGCTACAGTGAATAGGGACACTGTGCGCCATCTCAGGGCAGAGGAAAGGGGAGAACCAGTGACCTTCTTCCTCTCTGAGTGTCTGTCTCTCATTGCCACCCATGCAGAAGGGACTCCCTTAAACACAAGGAGAAGTTCCTGATGCTGGATGACAAGGCAATGACAGATACCCAGTAAAACCAAGTCCATGCGGCCTCAATGGGAAGAGCTCATTCTGAAAATGTAGTTCCAATTTCTAATTCAGTCCTCTTTCCACTATACTACTTTGCATAATAAGCAACAGGTGTTGGAATATGACCCTCTTCTCATGACTGTTGTTGTTATCATAAAACAAAACCTTCTACCATTACTTAGTCTTTTATCATTTACAAAGAAATCCCTTTTTAGTGACCTTTATAACCACCCTGAGAGGGAAGCAGGCAAGTAAATAACTCTATTTTCTTTTCTTCTTTATTTTTTCTGATAACAAAATGTCTAAAGAAGCACCTGGTACTTATGTAATCAAAGCACTTCCAATACTGAAACAAAAC	~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~P~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~h~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~q~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~^~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~q~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~V~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~`~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~m~r~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>~~~~~~~~~~~~~T~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~z~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~z~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~n~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~x~~~~~~~V~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~m~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~L~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~N~~~j~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~~`~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~b~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~f~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~T~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~R~~~~~~~~~~~~~~~~~~~~~~~C~~~~~~~~~~~~~~~~	RG:Z:${TMP_DIR}	NM:i:63	ms:i:19626	AS:i:19671	nn:i:0	tp:A:P	cm:i:1182	s1:i:9621	s2:i:635	de:f:0.0028	rl:i:458

@quanc1989
Copy link

@mebbert Excuse me, did you find a solution to this problem?

@mebbert
Copy link
Author

mebbert commented Sep 8, 2023

Hello @quanc1989: we haven't heard anything back about a fix on the issue. Are you seeing it too?

To get around it, we lowered validation stringency for this sample. We don't like doing that, but it shouldn't be a problem.

@quanc1989
Copy link

Thank you @mebbert . I also encountered this error when aligning to CHM13 v2. I also suspect that the reference affects this error. I will try to lower validation stringency for PICARD. Thanks a lot.

@AsmaaSamyMohamedMahmoud
Copy link

AsmaaSamyMohamedMahmoud commented Dec 20, 2023

Hi mebbert and quanc1989,
I also got same error from picard. I used minimap2 v2.26 and aligned to CHM13 v2. I tried with same sample aligned to hg38 and it was successfully completed without lowering the validation stringency for picard. @quanc1989 your suspect for the reference effect seems correct but I don't know why

@mebbert
Copy link
Author

mebbert commented Dec 20, 2023

Thanks @AsmaaSamyMohamedMahmoud and @quanc1989!

Interesting to see that the reference does matter.

@pustoshilov-d
Copy link

pustoshilov-d commented Jan 16, 2024

2024, I'm with you
I have

No M or N operator between pair of I operators in CIGAR
No M or N operator between pair of D operators in CIGAR

on ONT reads after minimap2 on hg38 in dorado basecalling [email protected] at 5% of my samples
However they are using minimap2-2.25 (r1173) fork (but no such fixes decaried in 2.26, so...)
I could provide reads if it would be usefull

Next I gonna test CHM13 v2

@gforg34
Copy link

gforg34 commented Mar 4, 2024

Hi everyone,

I've run into a similar issue with this thread as well. So in my case I used minimap2(v2.26) and bwa, but also I wanted to mark and remove the duplicate reads using sambamba markdup or PICARD MarkDuplicates.
1)
In the first scenario using BWA and sambamba everything worked smoothly, identifying the duplicates and then removing them successfully. However, I used the same reference genome but from the ENA browser.
2)
When using minimap2 with sambamba and a same reference from RefSeq I encountered this error:
[W::bam_hdr_read] EOF marker is absent. The input is probably truncated
I did check the BAM files and SAMfiles with quickcheck and everything seemed okay to me.
Then I found another thread that tries to fix the sambamba issue since I was thinking this is a sambamba problem. So, using this time dev sambamba markdup /dev/stdin . However, this gave me this error:
sambamba-markdup: not enough data in stream
3)
So then I decided to use PICARD instead as alternative, and then this brought me to this thread, because I had the following error:

Exception in thread "main" htsjdk.samtools.SAMFormatException: SAM validation error: WARNING::ADJACENT_INDEL_IN_CIGAR:Read name m84128_231104_112949_s2/253035149/ccs, No M or N operator between pair of I operators in CIGAR
        at htsjdk.samtools.SAMUtils.processValidationErrors(SAMUtils.java:457)
        at htsjdk.samtools.BAMRecord.getCigar(BAMRecord.java:284)
        at htsjdk.samtools.SAMRecord.isValid(SAMRecord.java:2103)
        at htsjdk.samtools.BAMFileReader$BAMFileIterator.advance(BAMFileReader.java:848)
        at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:834)
        at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:802)
        at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:574)
        at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:553)
        at picard.sam.markduplicates.MarkDuplicates.buildSortedReadEndLists(MarkDuplicates.java:524)
        at picard.sam.markduplicates.MarkDuplicates.doWork(MarkDuplicates.java:257)
        at picard.cmdline.CommandLineProgram.instanceMain(CommandLineProgram.java:305)
        at picard.cmdline.PicardCommandLine.instanceMain(PicardCommandLine.java:103)
        at picard.cmdline.PicardCommandLine.main(PicardCommandLine.java:113)

To sum up, I think the problem might have something to do with minimap2, but I'm not entirely sure what it is. Did someone have already found any solution?

Thanks

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants