相关动态
EGA(European Genome-Phenome Archive)数据申请下载
2024-11-10 23:01

太大的数据还是放弃下载吧 几个月过去,本来以为pyega3不行的话ascp肯定行 结果43T下载下来17T,c4gh解码失败了一半 有这些时间干点啥不好,裂开

EGA(European Genome-Phenome Archive)数据申请下载


3个月前完全没有想到会这么坎坷 -_- |||

一般在文章Methods或者Data Availability部分


官网写的python,但我服务器python是2,python3才是3 然后我不知道为啥只能在pyega3父目录才能调用这个模块,不管了本急急国王无所谓 -c感觉相当于多线程下载,会快一些,官网建议好像是从30开始试,但我发现5就差不多到头了

总的来说官网介绍的步骤还是很清晰,选择也很多,但很多时候还是要自己长个心眼,不然就会因为很蠢的问题卡很久

下载下来文件大小不完全一样,但是还好MD5对上了,吓我一跳 -_- |||


祝我好运吧


ftp下载的那个大概3月3号就可以下载完,使用钞能力扩容到150G存储,带宽加到12Mbit/s, 每天可以下载100Gb左右,虽然总共也要花将近一个月,好歹是能看到希望

EGA自己提供软件下载的我已经有点佛了,43T的数据,1Mb/s的速度都达不到,各种报错,发好几次邮件过去也没人搭理,所以前两天在Github发了帖,还收到一位印度友人的评论说完全一毛一样的问题,甚至下载到最后还要来一个MD5不对应的终极折磨,我真的麻了,求求EGA不要再用pyEGA3折磨我,给我个Aspera账号吧

他们确实有在努力优化pyEGA3,但效果属实不咋地,软件下载的话conda应该是最方便的,一步到位,最新版,pip3 install 如果版本不够高就下不到最新的软件,然后就会被staff要求试试最新版的新参数,nmmd根本屁用没有


ftp下载的顺利结束,虽然比预计晚了2天

Ega helpdesk回邮件给我Aspera账号啦,只是Aspera下载下来的文件是加密的,到时还得解密,不知道要花多久,但是下载速度可以有4.5-5MB/s了,虽然还是很慢,但MD5出问题的概率应该会低一些吧(求求了

本来想几个设备一起下载的,结果ascp它一个账号不支持双开,麻了 还好申请数据的时候给师兄账号也顺手申请了,试试能不能再要一个ascp账号吧

ascp也是挺烦,不懂得断了自动重连的 (-_-||| 睡一觉起来发现刚睡下就断了,麻

师兄申请Aspera账号的邮件惨遭拒绝,理由又是他妈的我们进行了一些优化你再试试不行再说

好在我的ascp多开成功,两台linux设备同时下载

但是windows设备怎么都用不了ascp,一直报failed to authenticate,所以我就在windows设备用回pyega3

    以上就是本篇文章【EGA(European Genome-Phenome Archive)数据申请下载】的全部内容了,欢迎阅览 ! 文章地址:http://changmeillh.xhstdz.com/quote/70772.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://changmeillh.xhstdz.com/mobile/ , 查看更多   
发表评论
0评