일단…
1. 염색체가 X, Y, 미토콘드리아 염색체가 들어가있다보니 필연적으로 문자가 들어갈 수 밖에 없음. 그렇다보니 Series 자체가 object이고 정렬이 숫자 순서가 아니라 1 10 11 12 이런 식으로 된다. 전에 Scatter plot때도 그랬는데 걔는 적어도 Numeric으로 바꿔주면 낫지… 얘는 염색체가 저러는거라 Numeric이 안돼서 답이 없어요… (마른세수) 정확히는 scatter plot 그릴 때는 데이터에 결측값 다 날려주고 해결본거지만 얘는 날려먹을 수 없는 데이터다.
2. Groupby로 묶은 건 좋은데 Aggregate도 안먹히고([] 쳐봤는데 안먹힌다…) 그룹바이로 뭉텅이로 묶는것도 안먹힌다. (마른세수 2) (뭉텅이: groupby([‘A’,’B’])로 묶는 것) 그룹바이.count()는 먹힌다.
3. 코드 돌리는 데 시간이 너무 오래 걸린다. 그래서 Jupyter로 하려고 했더니(얘는 interpreter라서 필요한 블록만 실행하는 게 가능하다) Jupyter에서 vcf를 못 불러온다.
궁서체로 스택오버플로우에 물어봐야 하나 고민중임…
+해결은 봤는데 진짜 의외의 포인트에서 해결됐다.
데이터 자체가 리스트로 되어 있던 걸 걍 문자열로 바꿔벌임… (놀랍게도 실화였다)
Reply