Author: Jin

과학자는 글을 쓰는 직업이다

과학자는 글을 쓰는 직업이다. 무슨 이야기냐고 반문할지 모르겠다. 소설가처럼 책을 쓰는 것도 아니고 기자처럼 매일 글을 쓰는 것도 아니다. 하지만 과학자는 논문이라는 이름의 글을 쓴다. 그 양이 많지 않고 길지 않지만 많은 내용이 함축적으로 들어가 있는 논문을 통해 과학자는 그들의 발견와 연구를 세상과 공유한다. 따라서 과학자에게 글을 잘 쓰는 것은 매우 중요하며 또 생각보다 하는 일에 많은 양과 시간을 차지한다.

그래서 과학자들도 글쓰기에 대한 훈련이 필요하다. 글쓰기가 그들의 주된 직업은 아니지만 그들의 직업을 잘 하기 위해 필요한 중요한 기술중에 하나이기 때문이다. 글을 잘쓰기 위한 훈련에 관한 많은 글들이 있다. 예를들면, 이글에서는 글을 잘 쓰기 위해 조금씩이라도 매일 글을 쓸것을 권유하고 있다. 이게 생각보다 실천하기 어려운데 생각보다 효과가 좋다.

매일 글을 쓰는 습관을 들이기 좋은 방법이 블로그를 쓰는 것이다. 너무 짧지도 길지도 않게 매일 조금씩 쓰다보면 어느새 글쓰는 습관이 들게 마련이다.

데이터 사이언스와 R 이야기

최근 딥러닝(deep learning)과 더불어 데이터 사이언스(Data science)가 각광을 받고있다. 많은 사람들이 코딩을 배우려고 노력하고 있고 많은 가능성을 이야기 하고 있다. 그리고 그 중심에는 R과 파이선(python)이 있다. 데이터 사이언스는 그 특성상 큰 사이즈의 데이터를 사용하게 되고 계산의 효율성과 더불어 command-line 을 기반으로 한 코딩을 선호하게 된다. 이에 더불어 R과 파이선이 무료라는 점이 강점으로 작용한다.

최근 읽은 글(http://www.datasciencecentral.com/profiles/blogs/why-r-is-bad-for-you)에서 이를 전면을 반박한다. SAS와 SPSS에서 만들어온 사용자 편의의 드래그-앤-드랍 시스템이 사람들에게 좀 더 중요한 모델에 집중하게 해준다는 것이다. 또한 그렇게 하는 것이 규모가 큰 회사에서 표준화 하기에 적합하다는 것이다.

나는 이 주장에 반대한다. 코딩은 생각보다 어렵지 않으며 대부분의 작업은 컴퓨터 전공자만 할 수 있는 정도의 실력을 요구하지 않는다. 새로운 기술을 습득하는데 걸리는 시간이 있겠지만 이후에는 기술이 당신에게 날개를 달아줄 것이라고 확신한다.

논문 작성에 구글 번역기를 쓰자!

영어로 논문을 작성하는 것은 많은 한국인들에게 쉽지 않은 일이다. 하지만 현재 과학계에서 표준 언어로 사용되는 영어로 논문을 작성하는 것은 매우 중요한 일이다. (나를 포함해서) 많은 사람들이 ‘한국어로는 어떻게 써야 할지 알겠는데 영어로 쓰려면 막막해 진다’고 한다. 그런데 아쉽게도 지금까지 번역기는 대부분 엉망진창, 말도 안되는 영어를 쏟아내기 때문에 차라리 안쓰는게 낫다는 생각이 들 정도였다. 하지만 최근에 (현재 글을 쓰고 있는 2017년 3월 30일에서 1~2개월 전부터) 갑자기 구글 번역기의 성능이 매우 좋아지기 시작했다. 최근 구글 번역기에 Deep learning을 이용한 AI를 사용하기 시작했다고 하던데 아마도 이것이 이유인 듯 하다. 실제로 번역을 해보면 약간의 교정만 보면 그대로 논문에 사용할 수 있을 정도의 문장이 나온다. 그래서 본인은 그동안 많은 선배들의 조언과 충고에 반대되는 말을 감히 해보려 한다.

논문 작성에 구글 번역기를 쓰자!

물론 이 말은 많은 것들을 전제로 하고 있다. 첫째, 당신이 쓴 한글 문장이 ‘말이 되는’것 이어야 한다. 의외로 많은 사람들이 잘못된 한국어를 구사한다. 흔히 ‘비문’이라고 하는데, 문장안에서 주어와 동사등의 구성요소가 적절히 사용되지 못하는 것을 말한다. “Trash in trash out”이라는 말처럼 잘못된 한국어를 쓰면 그에 따른 영어 번역이 좋을리가 없다. 따라서 먼저 제대로 된 한글 문장을 쓰는 연습을 해야한다.

둘째, 한글로 논문을 써도 무슨말을 써야할지 막막하다면 그것은 당신의 영어실력이 아니라 국어실력과 더 나아가 논리력을 의심해 봐야 한다. 실험의 결과 (대부분 그래프 또는 표)를 놓고 이것을 말로 설명하는 것, 그리고 이런 결과들을 모아서 어떤 발견을 했는지 설명하는 것은 생각보다 쉽지 않은 일이다. 만약 본인이 이 부분에 실력이 충분하지 않다면 책을 읽어야 한다. 다른 사람들이 ‘사실’에 대해 어떻게 설명하고 논지를 이끌어 가는지 또 그것을 어떻게 논리적으로 설명하는지 많이 읽다보면 자연스럽게 어떻게 자신의 논문을 논리적으로 써야할지 알게 된다.

위에 언급한 두가지가 문제가 되지 않는다면 이제 더 이상 영어실력이 과학자의 발목을 잡지 않는 시대가 오기를 바란다. 어쩌면 이미 왔는지도 모른다.

트럼프의 TPP탈퇴 선언이 갖는 의미

오바마가 추진했던 TPP를 트럼프가 뒤집었다. 취임한지 몇일 되지도 않아 가장 먼저 한 일이 TPP 탈퇴에 서명한것이다. TPP는 환태평양경제동반자협정 으로써 미국, 캐나다, 일본, 오스트레일리아, 브루네이, 칠레, 말레이시아, 멕시코, 뉴질랜드, 페루, 싱가폴, 베트남, 총 12개 나라간의 자유무역 협정이다. 한국은 회원국이 아니다.

오바마는 중국을 견제하기 위해 이 협정을 추진했으나 트럼프는 이를 뒤집었고 트럼프의 ‘미국 우선주의’에 기반한 무역 방향을 보여주는 예라고 할 수 있다. 재미있는 것은 트럼프가 몸담고 있는 공화당의 인사들은 우려를 표명한 가운데 오바마가 몸담았던 민주당의 인사들은 환영을 표명했다. 이유는 미국 중산층 노동자에게 이로운 일이라는 것이다.

이를 종합해 보면 미국의 TPP탈퇴를 통해 이익을 볼 대상은 중국, 미국의 노동자일 것이고 손해를 볼 대상은 미국의 대기업일 것이다.

미국의 노동자들이 혜택을 본다고 해서 트럼프가 취약하고 소외된 계층을 돌보는 사람이라고 생각하면 오산이다. 일단 미국 중산층 노동자는 소외계층이 아니다. 오히려 트럼프가 대통령이 되는데 일조한 대다수의 유권자들이다. 또한 진정한 소외계층 중 하나인 이민자에 대한 트럼프의 정책은 부정적이며 조만간 이 부분에 대한 행동이 있을 것으로 예상된다.

사이언스 어드밴스 (Science Advances)

세계적으로 영향력있는 저널중에 하나인 사이언스에 보면 사이언스 어드밴스 (Science Advances)라고 하는 나온지 2년 가량 된 저널이 있다. 2015년 만들어진 이 저널은 Open access가 특징으로 종이로 프린트하지 않고 온라인으로만 발행하는 것을 특징으로 하는 저널로 시작하였다. 이 저널이 만들어지기 전 몇몇 과학자들은 비싼 원고료(논문을 게재하기 위해 내야하는 돈)와 상업성을 제한하는 라이센스를 이유로 우려를 보인 바 있다. http://www.newstatesman.com/science/2014/08/new-scientific-journal-science-advance-condemned-open-access-advocates

지난 3년 통계를 이용하는 Impact Factor의 계산 방식때문에 아직 이 저널의 Impact factor가 얼마나 높은지는 알 수 없지만 PeerJ, PlosOne과 같이 요즘 과학계에 Open access 가 대세이기에 사이언스의 이런 행보가 전혀 이상한 것은 아니다.

앞으로 이 저널이 어떻게 발전할지, 아니면 PlosOne과 같이 처음에 반짝하다가 급격한 Impact factor 저하를 보일지 두고 볼 일이다.

Stand on the shoulders of giants

구글 스칼라 (https://scholar.google.com/)에 들어가보면 “Stand on the shoulders of giants” 라는 문구가 있다.

이 문구는 아이작 뉴튼 (Issac Newton)이 한 “If I have seen further it is by standing on the shoulders of Giants”에서 나온 말이다. 아이작 뉴튼에게 성공의 비결을 묻는 사람들에게 뉴튼은 “내가 멀리 볼 수 있었던 이유는 거인의 어깨위에 올라서 있었기 때문입니다.”라고 대답했다고 한다. 자신의 성공을 다른 사람들의 업적 위에서 이루었다고 말하는 겸손한 대답이다. 과학을 하는 사람들에게 ‘거인’이란 다시말해 다른사람들이 쌓아놓은 업적이란 퍼블리시 된 논문일 것이다. ‘거인의 어깨 위에 선다’는 구글 스칼라의 문구는 논문을 검색하는 입장에서 가장 잘 어울리는 표현이 아닐까 싶다.

이즈미 (ISME) 2016 참석 후기

캐나다 몬트리올에서 열린 ISME (International Symposium on Microbial Ecology) 2016에 참석하였다. ISME는 2년에 한번씩 열리는 국제 학회로 이번에 16번째이다. 5개 대륙을 돌아가며 열리는데, 지난번에는 아시아(한국)에서, 이번에는 북미(캐나다), 그리고 다음에는 유럽(독일)에서 열린다. 백만원에 가까운 등록비용에 멀리까지 와야해서 비싼 비행기표에도 불구하고 매번 천명이 넘게 참석하는 ISME는 Microbial Ecology분야에서 가장 큰 학회라고 할 수 있다. 총 6일에 걸쳐 진행되는데 (길기도 하다!) 첫날은 등록과 환영사 정도이고 네번째 날은 세션이 없는 걸 감안하면 총 4일의 학회라고 볼 수 있다. 아주 특이한 점은 네번째날 아무 스케줄이 없고 사람들이 모여서 주변 관광을 하는 날을 주는 것이다. 다른 학회에 없는 특별한 스케줄인데, 사람들이 학회에서 관광과 세션 참석간의 고민을 모두 충족시켜 주는 스케줄이라고 할 수 있다. 다만 이것때문에 학회에 총 6일에 걸쳐 진행되는 정말 긴~ 학회이다. 4일간 진행회는 메인 스케줄도 하나도 놓치고 싶은게 없을 만큼 내용이 매우 충실하다. 대부분의 Talk이 이 분야에서 명성이 있는 사람들이 초대되고 포스터도 좋은 내용이 많다 (포스터라고 해서 쉽게 볼 내용들이 아니다!). 또한가지 장점은 이 분야의 대가들을 모두 볼 수 있는 자리라는 것이다. 정말 대단하게도 이 분야의 대가들이 ISME에 매번 참석한다! 이들의 발표를 직접 들을 수 있는 것만해도 백만원에 가까운 등록비가 아깝지 않을 정도이다. 예를들면 Soil micobial ecology의 James Tiedje, Martin Hartmann, Vanessa Bailey, Janet Jansson,그리고 Ocean micro biology 의 Sallie Chisholm, 그리고 Evolution의 Richard Lenski, 그리고 Single-cell microbiology 의 Ramunas Stepanauskas 등이 있다. 내 생각에 이번 ISME의 깜짝 스타는 한 organism에서 complete nitrification을 할 수 있는 박테리아를 찾아낸 Holger Daims 였다.

다양한 세션이 준비되어 있는데, Soil, Ocean, Fresh-water , human microbiome 등의 분류도 있고, microbial ecology, ecological theory 등의 분류, 그리고 imaging, single-cell genomic와 같은 method중심의 분류 등이 준비되어 있다. 자신이 관심있는 분야에 계속 듣는것도 좋지만 다양한 분야를 다양하게 들어보는 것도 좋은 방법이다. 개인적으로는 Soil, Ocean쪽의 발표는 상당해 수준이 있었으며, Fresh-water쪽은 약간 아쉬웠다.

당연한 것이지만 약간 아쉬운 점은 인기와 비인기 talk의 관중 수가 너무많이 차이가 난다는 것이다. 누구나 비싼 참석비를 냈으니 유명한 사람의 talk을 찾아가는 것은 이해하지만 대가 중심의 쏠림 현상이 심하다는 느낌이 들었다.

이 외에도 저녁시간에는 토론 세션이 준비되어 있는데, 분야의 대가라고 하는 사람들이 한자리에 모여 당면한 문제에 대해 토론하는 시간을 갖는다. 대부분 아는 내용이고 특별히 새로운 이야기가 나오는 것은 아니지만 분야가 약간 생소하거나 공부를 해야하는 학생들의 경우에는 정말 유익한 자리게 될 것같았다. 또 당면한 과제에 대해 다시한번 생각해 보고 어떤 사람들이 어떤 의견을 가지고 있는지 들어보는 것도 좋은 기회였다.

학회 홈페에지: http://www.isme-microbes.org

2012년 자두의 김밥

2003년 발매된 자두 3집에 수록되어 있는 ‘김밥’.

10년이 넘게 지난 어느날 갑자기 이 노래가 듣고 싶어 검색을 해보니 ‘2012 김밥’! 응? 이건 뭐지?

Ukelele 버전이라고 쓰여있는데, 우쿨렐레로 연주한게 새로 나왔나? 하고 들어 보았는데,, 똭!!!!! 엄청 좋다!!!! 원래 자두 목소리를 좋아 했는데, 세월이 주는 성숙함(?)이 느껴지는 이 목소리는 더 좋다!! 그리고 추억이 돋는 노래 참 좋다!!

스테이크 종류

안심 스테이크 , Tenderloin Stake

스테이크 중에 가장 기름이 적어 담백하고 부드러운 맛을 낸다.

등심 스테이크 , Sirloin

립아이 = 꽃등심 , Rib-eye

등심의 한 부위로 등심, 갈빗살, 귀중한살의 세가지 부위가 함께 있다. 가운데 있는 둥그런 부분이 등심, 뼈에 붙어 있는 부분이 갈빗살, 갈빗살 반대쪽 끝에 새우 모양으로 붙어 있는 것이 귀중한살(새우살)이다. 뼈가 붙어 있는 경우에는 Born-in Rib-eye 라고 부른다. 기름이 많고 강한 남성적인 맛이라고 불리운다.

뉴욕 스트림 = 채끝살, NY Strip

채끝살로 만들며, 등심중에서 가장 기름이 적어 담백한 맛을 낸다.

티본 스테이크

T자 모양의 뼈를 가운데 두고 안심과 등심이 같이 있다.

참고

http://food.chosun.com/site/data/html_dir/2013/01/04/2013010401744.html

http://food.chosun.com/site/data/html_dir/2013/01/14/2013011401787.html

http://food.chosun.com/site/data/html_dir/2013/02/04/2013020401646.html

http://food.chosun.com/site/data/html_dir/2013/01/29/2013012901603.html?related_all

http://food.chosun.com/site/data/html_dir/2013/01/18/2013011801856.html?related_all

예제로 보는 논문 요약 정리 방법

대학원에 처음들어와 논문을 읽기 시작하면 참 막막하다. 어떤 논문을 읽어야 하는지, 어떻게 읽어야 하는지 모르는 경우가 많다. 논문을 처음 보는 사람은 아래의 방법이 도움이 될 수 있다.

쉬운 논문을 하나 예로 들어보자. Identification of Soil Microbes Capable of Utilizing Cellobiosan (http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0149336 )

제목을 읽고 어떤 내용일지 추측해 본다. 여기서는 제목에서 Cellobiosan을 이용하는 박테리아를 확인했다! 라고 했으므로, 1) Cellobiosan이라는 것이 중요한 물질인가? 2) 박테리아를 관찰만 한건가 아니면 Isolate까지 한건가? 3) Isolate을 했다면 어떻게 했는가? 4) 그 박테리아가 어떤 녀석인지는 어떻게 알지? 정도의 궁금증이 생길 수 있겠다. 이런 질문들을 적어놓고 읽어가면서 답을 찾아나가면 되겠다.
이제 논문을 읽기 시작한다. 논문을 읽으면서 생각해 보아야 할 질문은 1) 이 연구가 왜 대단한가. 2) 구체적으로 어떤 사실을 찾아냈는가. 하는 것이다. 이 두가지 질문에 답을 하다보면 위에서 말한 네가지 질문에 자연스럽게 답이 찾아진다. 예를 들어 이 논문에서는 1) 자연계에 많이 존재하지만 누가 어떻게 이용하는지 잘 알려지지 않은 Cellobiosan 을 Isolate했다는 것이 주요 내용이다. 따라서 Introduction의 대부분을 Cellobiosan이 자연계에 얼마나 많이 존재하는지에 대해 자세히 설명하고 있다. 그리고 지금까지 알려져 있는 pathway에 대해서 설명한다.
Result에서 구체적으로 어떤 사실을 발견했는지 확인한다. Result 부분에 문단별로 나누어 정리하면 좀 더 편하다. 이 논문에서는 Result 부분에 총 네개의 문단이 있다. 1) 첫번째 문단에서는 어떤 방법으로 Cellobiosan을 이용하는 박테리아를 Isolate했는지, 그리고 이 박테리아가 Cellobiosan을 이용하여 자라는지 확인한 내용이 나온다. 2) 두번째 문단에서는 Isolation 한 박테리아들이 다른 여러종류의 배지에서 키워 levoglucosan도 이용한다는 것을 찾아낸다. 3) 세번째 문단에서는 새로 얻은 녀석들이 어떤녀석들인지 확인한다. 이를 위해 이미 알려진 녀석들와 16s 유전자의 시퀀스를 비교해 어떤 녀셕들과 가장 비슷한지 알아낸다. 4) 마지막 문단에서는 이 녀석들이 자연계에서 얼마나 존재하는지 확인한다. 이를 확인하기 위해 다른 샘플의 전체 16s amplicone sequncing 데이터와 비교해보니 Isolation 한 녀석들이 많지는 않지만 다른 샘플에서도 존재한다는 것을 알아냈다.
마지막으로 Discussion 을 통해 이 연구를 어떻게 발전시킬 수 있는지, 내 연구에는 어떻게 적용하면 좋을지 생각해 본다.