元宵节把SciHub Spider搬到了个人订阅号上,从此无视终端随心查看文档
微信推文链接:https://mp.weixin.qq.com/s/RulEtKY2L0iChQEq5ZSmJQ
一般只有遇到闪退bug或者scihub主站更新需要重新适配我才会更新软件,不会太频繁,一切以维护可用性为先,大家放心。
请注意由于SciHub网站更新,所以旧版本(1.6.2以前)都可能会无法正常解析到文献下载地址且大概率出现闪退,请更新新版。
软件自1.6.4开始使用自费服务提供软件更新,希望觉得好用的同学打赏一二,以cover服务器流量费用,谢谢!打赏链接
软件只要检测到更新就会自动下载更新包到桌面,大家只需双击安装即可(macOS用户解压直接可运行),不安装更新软件将无法继续使用。
下载地址:
又用回百度云了, 囧
- Windows: SciHub-Spider-update-latest
2. macOS(解压直接运行就可以): SciHub-Spider-update-1.6.6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
|
2018/08/27 1.7.1:
1. 更新正则匹配规则以适配scihub网站更新
2. 七牛云测试域名到期,更换MQTT服务来检测更新
3. 正则匹配规则支持热更新
4. 公众号增加邮件发送文献镜像下载地址功能
2018/07/25 1.7.0:
1. 修复网页重定向导致无法正常检索的问题
2018/05/03 1.6.9:
1. 更新正则匹配规则以适配scihub网站更新
2018/03/27 1.6.8:
1. 删掉几个不稳定的镜像节点
2. 修复偶尔下载失败造成的闪退问题
3. 移除不必要的静态资源
2018/03/02 SciHub Spider WeChat Bot:
1. 微信版闪亮登场,不再需要安装任何东西,关注即可
https://mp.weixin.qq.com/s/RulEtKY2L0iChQEq5ZSmJQ#opennewwindow
2018/02/16 1.6.7:
1. 去掉一个被ban掉的scihub镜像检测网站
2. 二维码求红包变为了福利链接,偷偷的别声张哈
3. 修复下载目标内容为空时程序闪退的问题
2018/01/16 1.6.6:
1. 修复scihub抽风引起的闪退问题
2. macOS版本继续发布
3. 增加应用签名,Windows10安装不再报应用未知的警告了
2018/01/15 1.6.5:
1. 修复CDN缓存导致更新检测失败的问题
2. 修复scihub网址列表为空时的报错问题
3. 安装包增加英文引导语言,避免有些区域语言配置有问题的系统报错
4. 验证打赏码md5值
2018/01/12 1.6.4:
1. 原网盘分享莫名被禁,故增加程序自动更新功能,弃用百度(使用七牛云存储服务)
2. 如果觉得微信赞赏码烦人,可以去程序根目录把wechat.jpg图片删除即可
3. 精力有限,不再提供免安装程序
4. macOS版本暂缓,可能要等下周
2018/01/11 1.6.3:
1. 适配SciHub网站更新
2. 增加了一个SciHub可用性检测站点
3. 增加微信赞赏码(更新不易,请多多支持)
2017/12/20 1.6.2:
1. 隐去scihub可用网站信息
2. 修复macOS模块引用的一个小bug
2017/12/19 1.6.1:
1. 修复文章标题包含特殊字符时程序闪退的问题
2. 修复检测scihub站点可用性时可能引起的闪退问题
3. 未检测到合法ID不再清空用户剪贴板内容
4. 增加从真实下载地址解析文章标题功能,如解析到则用作保存文件名,否则使用DOI代替
5. 延长检测可用scihub站点扫描超时时间(应对龟速网络)
6. 考虑系统兼容性增加64位专版,使用优先级“*支持xp”>“*免安装版不支持xp”>“*64位专版免安装”,如果都有问题,请反馈留言
2017/12/18 1.6:
1. 新增SciHub镜像站点可用性检测
2. 重写爬虫逻辑,提升文献下载能力
3. 改名改图标
4. 精简不必要的组件包,缩小安装包体积
5. 移除微信二维码捐赠图片
6. 提供安装板和免安装版两种选择
2017/12/14 1.5:
1. 兼容xp系统,完成Windows全平台支持
2. 首版安装版
3. 缩减程序体积
2017/12/14 1.4:
1. 兼容32位系统,xp依然不支持
2. 禁止ssl验证
3. 取消ssl禁用警告信息
2017/12/14 1.3:
1. 修复bug
2. 支持Windows 7 64位
3. 增加PMID/PMCID/Manuscript ID转换DOI支持
2017/12/14 1.0-1.2:
1. 初版,单文件,仅支持Windows10 x64位系统
2. 修复bug
2017/11/11:
1. 简单脚本, 仅在朋友圈传播
|
众所周知,因为版权问题,科研神器SciHub
近来并不稳定,频繁更换域名。为了方便单位科研同学,上周用Python写了SCI文献下载器,并在朋友圈发布,反响颇佳。周末又重新理了一遍逻辑,现在论文下载能力应该是得到了进一步增强。
工具原理很简单,主要利用了爬虫技术(老司机可以直接自己撸一个也没啥问题,纯体力活)。
程序首先会检测更新,发现新版本则自动下载到桌面,需要手动安装。
接着爬取目前可用的Sci-Hub
站点。
然后会以验证http.headers
的方式(一般网站的headers大小仅仅几百个字节,所以并不会对服务器造成什么压力)去探测Sci-Hub
可用站点在本地网络的连通性,保留本地确定可连的站点。
然后就开始检测用户剪贴板内容,如发现纯数字的PMID或者合法的DOI(通常以10.开头)就会自动去检索。
PMID/PMCID/Manuscript ID/DOI ID转换是通过爬取NCBI
主站获得。也就是说如果在NCBI
上找不到对应DOI的文章是不会下载的,这种情况就需要你自己想办法找到文章的DOI号,再尝试让程序检索下载。
拿到DOI号后即开始检索文献真实下载地址,优先从libgen.io爬取,爬取失败再去sci-hub
目前可用的镜像站点爬取。所以其实这里是从两个源头去下载,libgen服务比较稳定,Sci-Hub
相对不太稳。
爬取成功则将文章保存在用户桌面。
免安装版使用PyInstaller制作,只支持Windows7以上系统。(不再提供免安装版)
安装版使用cx_Freeze(打包)Inno Setup - JRSoftware(安装)制作,支持Windows XP系统,因为少了解压过程,不会产生系统垃圾,同时打开速度比安装版要快很多,推荐使用。
只需打开软件,复制要下载文章的PMID/PMCID/Manuscript ID/DOI等任一ID,程序可以自动从复制内容中解析出ID信息进行检索,找到文章即下载到桌面。
PS:打开软件和复制ID无先后顺序,你可以先打开软件再复制ID或者先复制ID再打开软件。
请注意,并不是所有的文章都可以下载的到!!!
Please note that not all papers can be downloaded successfully!!!
考虑到可能引起的资源滥用,暂不开源
SciHub-Spider-update-1.6.4
链接:https://pan.baidu.com/s/1boAEC4f
密码:dz4y
~~PayPal: https://www.paypal.me/ferstar~~
由于使用自费服务提供软件更新,所以希望觉得好用的同学打赏一二,以cover服务器流量费用,谢谢!

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
|
________________
| Sci-Hub Spider |
----------------
\ ^__^
\ (oo)\_______
(__)\ )\/\-
||----w |
|| ||
written by ferstar with love
USAGE: copy a DOI or any content that contains a valid DOI and wait
BTW: PMID/PMCID/Manuscript ID also supported but not recommended
Please note that not all papers can be downloaded successfully
BLOG: https://blog.ferstar.org/post/scihub_spider
Check the new version of SciHub Spider
Already the latest version, no need to update
Fetching available sci-hub mirrors
Sci-Hub mirror list updated
I need to check if scihub is available locally
It may take a few seconds, please wait
check site status "https://sci-hub***"...ok
check site status "https://sci-hub***"...ok
check site status "https://sci-hub***"...ok
check site status "https://sci-hub***"...ok
check site status "https://sci-hub***"...ok
check site status "https://sci-hub***"...ok
check site status "https://sci-hub***"...ok
ID detected: 29245169, need convert to DOI...
DOI converted: 10.1055/s-0043-122232, fetching...
try to fetch on "libgen.***"
Paper found, will download
Paper title: [Fehler und Schwchen ...] found
[Fehler und Schwchen ...] download completed 220.59 KB / 220.59 KB
[Fehler und Schwchen ...] has been saved on you Desktop
Press enter key to continue or click the close button to exit
|
欢迎加我微信反馈问题!