일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- EDA in python
- 경우의 수 파이썬
- 시계열 라이브러리
- sktime 예제
- pytorch 데이터셋 나누기
- weight 일부 고정
- pandas
- pandas 조건
- sktime
- pandas row 제거
- Skip connection
- sktime tutorial
- 모델 freeze
- pandas 특정 조건 열 제거
- python 경우의 수
- EDA 추천 파이썬
- pytorch dataset split
- 비선형함수 딥러닝
- layer 일부 freeze
- 선형함수 딥러닝
- pretraining
- 비선형함수
- molecular representation
- pandas 행 제거
- Graph Theory
- Prompt Tuning for Graph Neural Networks
- sktime 튜토리얼
- 일부 레이어 고정
- 판다스 조건
- Does GNN Pretraining Help Molecular Representation?
- Today
- Total
목록Bioinformatics/Fastq (2)
MoonNote

1. Basic Statistics Summary The Basic Statistics module generates some simple composition statistics for the file analysed. Filename: The original filename of the file which was analysed File type: Says whether the file appeared to contain actual base calls or colorspace data which had to be converted to base calls Encoding: Says which ASCII encoding of quality values was found in this file Tota..

FastQ FASTQ format은 'AGCT'로 표현되는 생물학적 sequence와 ASCII 문자로 표시된 각 염기에 대한 quality(Phred)score를 모두 저장하기 위한 Text-based format으로 주로 NGS 기술로 생산된 sequencing raw data에 많이 사용된다. 보통 quality 값은 두자리 숫자로 표시되다보니 대용량의 NGS data를 저장하는데 많은 용량을 차지하게 되기 때문에 사용 용량을 줄이기 위하여 quality 값을 아스키 코드로 대체한 것이다. FASTQ format은 높은 처리량 sequencing 기기의 출력을 저장하기 위한 실질적인 표준으로 자리 잡았다. Quality socre는 일반적으로 2 ~ 40 범위에 있는 정수(Q)이지만, 더 높은 값과..