NoteExpress

 找回密码
 立即注册
搜索
热搜: NE3 NE 3 已解决
查看: 2285|回复: 8

Noteexpress网络捕手网页识别题录、下载全文的问题

[复制链接]

2

主题

7

帖子

38

积分

新手上路

Rank: 1

积分
38
发表于 2023-10-29 23:01:28 | 显示全部楼层 |阅读模式
试了十几篇文献都识别不了,重装也不行,气得我直骂娘,都想摔电脑了。
又刷了半小时论坛,才发现这个识别这么不智能,网址后面如果加“#fig5”、“#f0035”、“?via%3Dihub”这些就识别不出来题录了。
Snipaste_2023-10-29_22-52-19.png
Snipaste_2023-10-29_22-52-39.png
非得把那些字符去掉,才能识别。
Snipaste_2023-10-29_22-53-08.png


这个识别逻辑不能改进一下吗?我用zotero以及别的参考文献管理软件,都可以忽略掉这些,识别出题录。

以及,下载全文的按钮为什么去掉了?我在校园网环境下,直接下载全文没有任何权限问题。
如果不能下载全文,那还不如下载pdf之后,再拖拽进noteexpress里。
如果不能下载全文,就只能保存一个网页,都无法记录自己读到了哪里。

我是犹豫再三,才从zotero转到了noteexpress,这些功能能不能完善一下,让noteexpress全方面超过zotero。
回复

使用道具 举报

203

主题

1万

帖子

3万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
33046
发表于 2023-10-30 09:12:37 | 显示全部楼层
您网址后面的“#fig5”、“#f0035”、“?via%3Dihub”  是从哪个网页跳转来的吗? 我试了下zotero也是无法识别的。 我这边反馈一下负责插件的技术,尽量会去支持。谢谢您反馈。
回复 支持 反对

使用道具 举报

2

主题

7

帖子

38

积分

新手上路

Rank: 1

积分
38
 楼主| 发表于 2023-10-30 17:25:24 | 显示全部楼层
本帖最后由 夏已微凉 于 2023-10-30 18:33 编辑
aegeansupport 发表于 2023-10-30 09:12
您网址后面的“#fig5”、“#f0035”、“?via%3Dihub”  是从哪个网页跳转来的吗? 我试了下zotero也是无法 ...

就是原来的文献网址https://linkinghub.elsevier.com/retrieve/pii/S2352152X2301157X,粘贴到浏览器访问之后,就会有这些。
比如这是我把?via%3Dihub去掉之后,用网络捕手保存到noteexpress里的,访问之后还是会自带?via%3Dihub。 Snipaste_2023-10-30_17-18-37.png


但是用zotero就可以正常识别并保存,如下图。
Snipaste_2023-10-30_17-19-20.png


出现#fig5的原因是,我看论文的时候会点击左边的导航,先看论文的图。
这应该是科研工作者经常碰到的一个状态吧,总得先看看论文符不符合自己期望,再决定要不要保存到软件里。
如果决定保存了,还要在地址栏删掉多余的网址,重新进入网址,才能保存,那有点麻烦了。
Snipaste_2023-10-30_18-32-56.png

回复 支持 反对

使用道具 举报

4

主题

368

帖子

2333

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2333
发表于 2023-10-31 09:34:21 | 显示全部楼层
夏已微凉 发表于 2023-10-30 17:25
就是原来的文献网址https://linkinghub.elsevier.com/retrieve/pii/S2352152X2301157X,粘贴到浏览器访问 ...

了解您的需求了,已经提交进行修复
回复 支持 反对

使用道具 举报

4

主题

368

帖子

2333

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2333
发表于 2023-10-31 18:37:17 | 显示全部楼层
问题已经修复了,您将浏览器缓存清除,再重启浏览器获取试下
sddddd.png




回复 支持 反对

使用道具 举报

2

主题

7

帖子

38

积分

新手上路

Rank: 1

积分
38
 楼主| 发表于 2023-11-1 21:15:38 | 显示全部楼层
gaizhui 发表于 2023-10-31 18:37
问题已经修复了,您将浏览器缓存清除,再重启浏览器获取试下

你们动作好快!点赞!

那我再提个小小要求,下载全文那个按钮能加上吗?
大部分人应该都是校内使用noteexpress的,是有权限下载全文的。
不需要像某些软件那样用doi跳转到sci-hub下载(这样可能对商业软件引来官司之类的?),直接在网页上下载可以吗?

这可能有点难度,因为不同网站的下载按钮不一样(可以只对主流网站适配一下,比如science direct),并且也涉及到了本地的存储问题(下载之后还要把文件移到noteexpress数据库的对应文件夹里)

noteexpress客户端的下载全文我也试过,总感觉很慢,不清楚为什么,我在网页端下载是秒下载的。
回复 支持 反对

使用道具 举报

4

主题

368

帖子

2333

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2333
发表于 2023-11-2 18:24:31 | 显示全部楼层
夏已微凉 发表于 2023-11-1 21:15
你们动作好快!点赞!

那我再提个小小要求,下载全文那个按钮能加上吗?

浏览器点击按钮,直接就能拿到全文的下载地址,而NE客户端执行检索和下载跟浏览器不太一样需要多层处理交互后拿到地址下载,所以浏览器一般会快一点,这个已做记录反馈给技术部门看能否再做些优化。
浏览器插件增加外文网站下载按钮,比如science direct,很多详情页中没有直接提供下载入口需要跳转预览,有的文献下载需要登录,人机验证等操作确实比较复杂,需求会反馈给技术部门研究下
回复 支持 反对

使用道具 举报

5

主题

13

帖子

67

积分

注册会员

Rank: 2

积分
67
发表于 2023-11-2 22:42:49 | 显示全部楼层
gaizhui 发表于 2023-10-31 09:34
了解您的需求了,已经提交进行修复

谷歌学术的搜索结果 还是无法采集期刊名称
回复 支持 反对

使用道具 举报

4

主题

368

帖子

2333

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2333
发表于 2023-11-3 09:56:20 | 显示全部楼层
lansttt 发表于 2023-11-2 22:42
谷歌学术的搜索结果 还是无法采集期刊名称

谷歌学术的数据来源于不同的数据库网站,列表页中文献参数不规范,捕手准确获取各字段信息有难度,优化了一版部分文献能获取到作者,这边会再研究下继续优化,也请谅解。您可以先将文献保存到NE,使用智能更新下数据。
回复 支持 反对

使用道具 举报

*滑块验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|NoteExpress

GMT+8, 2025-9-13 18:05 , Processed in 0.142615 second(s), 24 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表