PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2016/05/03 19:19:07
Name 해바라기
File #1 캡처_1.JPG (175.2 KB), Download : 20
File #2 캡처_2.JPG (59.5 KB), Download : 3
Subject [질문] 수백개의 텍스트 파일에서 원하는 정보만 추출하고 싶습니다.




암을 연구하는 학생입니다.
이쪽 분야에서는 환자의 암 조직에서 발현되는 유전자의 양을 전부 조사하고 있는데,
이 자료를 조금 간단히 보고 싶습니다.
(수 많은 암 환자의 암 조직에서 발현되는 모든 유전자의 양을 살펴보고 있습니다)

위쪽 사진(캡처 1)은 제가 받은 text 파일이고요
이 파일을 강제로 엑셀로 열면 아래 그림 (캡처 2)과 같이 열립니다.
엑셀에서 A 패널은 모든 텍스트 파일에서 공통된 부분이고
B 패널에 있는 것이 유전자 발현량입니다.

제가 하고 싶은 것은
예컨대 ABCA3|21 의 발현량을 다 알고 싶은 겁니다
즉, 텍스트 파일 안에 있는 ABCA3|21 우측에 있는 1081.442와 같은 정보를
다 알고자 하는 것이죠 (1081.442 1523.332 1023.445 등의 정보만 얻으면 됩니다)

저 수많은 텍스트 파일을 하나하나 열어서 확인하는 것........ 말고
자바라든가 (자바 할 줄은 모르지만 어떻게든 배워봐야죠!)
여러가지 프로그램 등을 활용해서
이걸 쉽게 할 수 있는 것은 없을까요?

긴 질문 읽어주신 분들에게 모두 감사드립니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
회색사과
16/05/03 19:58
수정 아이콘
파일을 직접 보지는 못해서 단정적으로 말씀드리기는 어렵지만

어렵지 않게 될 문제긴 하네요...
언어 종류에 상관없이 ...
파일입출력하고 조건문 하나만 쓰시면 될 것 같습니다.

1. 폴더 안의 모든 파일을 순차적으로 열었다가 닫는 코드 검색해보시고,
2. 텍스트 파일 하나를 열어 한 줄씩 받아서 원하는 유전자 코드에 따른 값을 카피해서
3. 새로운 텍스트 파일에 순차적으로 쓰게

만 하면 될 것 같습니다.
회색사과
16/05/03 20:00
수정 아이콘
코딩을 손놓지 않은 컴공과 친구가 있다면
스벅 커피 한 잔이면 15 분 안에 만들어 줄겁니다

(파일 형태에 따라 난이도가 조금 달라질 수는 있어요)
배나무
16/05/03 20:03
수정 아이콘
TXT 파일을 병합해서 한파일로 만들고
엑셀로 열어서 필터걸어서 정렬하면 될것같은데
구글로 텍스트 파일 병합하는거 찾아보시면 될듯하네요
배나무
16/05/03 20:08
수정 아이콘
커맨드 윈도우 들어가셔서 텍스트 파일 저장된 경로로 가시고 "copy *.txt output.txt" 치시면 병합이 돼요
좋은하루되세요
16/05/03 20:50
수정 아이콘
배나무님 방법도 좋아보이고,

직접 코드를 짜서 하고 싶으시다면,
학생이시니......... 학교에서 matlab 지원하면 matlab으로 시도해보시는걸 추천합니다.
김성수
16/05/03 21:08
수정 아이콘
FINDSTR을 사용하면 가장 손 쉽게 될 것 같습니다.
[윈도우키 + R] -> cmd 입력 -> [Enter] -> 명령어 입력 -> [Enter]
딱 이렇게 되거든요.

제가 명령어 써드릴라고 했는데, 그 전에 내용이 어떤식으로 구성되어있는지 알아야 되서 말이죠.
(FINDSTR이 다른 프로그래밍 언어들이 지원하는 수준의 정규식을 지원하지 않는지라.. 텍스트 구성에 따라 불가능할 수도 있습니다.)
지니랜드
16/05/03 21:23
수정 아이콘
우선은 굳이 프로그램 만드는 거보다 에디트플러스같은 텍스트에디터에서 Find in Files 로 파일들 있는 폴더 선택하고 해당 키워드로 찾으시는게 좋을거 같습니다.
해바라기
16/05/03 22:05
수정 아이콘
이렇게 많은 답변이 달릴 줄 몰랐습니다......
답변 주신 분들 모두 감사합니다.
답글 중에 반은 이해하고, 반은 어려운데
컴공과 친구에게 커피 사주면서 이 글 보여주고 도움을 요청해야겠네요.

모두모두 감사합니다!

(급한 부분은 텍스트 파일을 일일히 엑셀로 열어서 해결은 했습니다.)
동네형
16/05/03 22:09
수정 아이콘
그게 정답입니다. 머리 좀 굴릴 줄 아는 컴공 학생이면 10분꺼리도 안될겁니다.
제이슨므라즈
16/05/03 22:11
수정 아이콘
acroedit 프로그램에서 폴더내 텍스트 파일 내용을 검색하는 기능이 있습니다.
검색문구가 있는 열은 모두 표기되고 그줄만 엑셀에 옮겨 붙이시면 되실거같아요
16/05/04 10:25
수정 아이콘
다른 처리가 필요한 것이 아닌 딱 질문한 내용만 갖고 생각해 보자면

1. 배나무님 말씀처럼 우선 텍스트파일 병합
2. 엑셀로 열어서 위 캡쳐 화면처럼 정리
3. 데이터 영역 전체를 선택한 뒤 삽입->표 클릭 -> 표만들기 -> 확인
4. 맨 위 메뉴에서 찾고 싶은 값으로 필터링

하면 딱히 코딩없이도 가능할 것 같습니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
82407 [질문] 텐서(Tensor)에 대한 쉽고 좋은 글 부탁드려요! 소야테1582 16/05/03 1582
82406 [질문] 신나는 노래 추천 부탁드립니다 [10] croissant2247 16/05/03 2247
82405 [질문] 유부남 용돈 30만원 준다고 하네요... [71] 고등어3마리9790 16/05/03 9790
82404 [질문] 부산 광안리 수변공원에서 회 어떻게 먹나요? [2] 삭제됨2219 16/05/03 2219
82403 [질문] 공부방법 질문해봅니다 콜라곰1482 16/05/03 1482
82402 [질문] 멘토가 되고 싶은데 방법이 없을까요? [7] 윌모어2126 16/05/03 2126
82401 [질문] 엑셀 관련된 책 Jedi Woon1853 16/05/03 1853
82400 [질문] 주말에 차가 얼마나 막히나요? [10] 랑비2140 16/05/03 2140
82399 [질문] 유튜브 자막관련 Bloom2161 16/05/03 2161
82398 [질문] 토렌트로 해킹 가능한가요? [10] Biemann Integral11374 16/05/03 11374
82397 [질문] 뉴욕 여행 전에 볼만한 뉴욕 관련 영화가 있을까요? [17] 순욱3166 16/05/03 3166
82396 [질문] [영화] '황해' 후기가 궁금합니다. (스포 X) [22] Propose3569 16/05/03 3569
82395 [질문] 노래를 찾고 있습니다. [7] 어바웃타임1334 16/05/03 1334
82394 [질문] [LOL] 칼바람 나락 대회를 진행하는데 있어서 의견을 받습니다. [4] lenakim2509 16/05/03 2509
82393 [질문] 식사예절 질문(접시 쌓아놓고 먹기) [11] 잠이오냐지금7228 16/05/03 7228
82392 [질문] 수백개의 텍스트 파일에서 원하는 정보만 추출하고 싶습니다. [13] 해바라기6119 16/05/03 6119
82391 [질문] 인간관계 때문에 항상 불확실하게 말을 해야하는 것에 대해 어떻게 생각하시나요?? [7] 우리집개2407 16/05/03 2407
82390 [질문] 혹시 이 향수 아시는분 계신가요? [3] 손예진1993 16/05/03 1993
82389 [질문] [마블] 코믹스 추천 부탁드립니다. [2] 스파이어깨기2762 16/05/03 2762
82388 [질문] 혹시 가스안전공사 면접보신 분 계신가요? 영슈영슈1609 16/05/03 1609
82387 [질문] 어버이날 선물 DogSound-_-*1442 16/05/03 1442
82386 [질문] 바탕화면용 그림을 다운 받았는데 화질 구립니다. [3] 스팍2129 16/05/03 2129
82385 [질문] 전과기록 조회 권한이 법무법인에도 있나요? [10] 삭제됨4238 16/05/03 4238
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로