写作绅士,读作丧尸 X岛揭示板
顺猴者昌 逆猴者亡 首页版规 |用户系统 |移动客户端下载 | 丧尸路标 | | 常用图串及路标 | 请关注 官方公众号:【X岛揭示板】 官方微博: 【@X岛极速版】| 人,是会思考的芦苇
常用串:·豆知识·跑团板聊天室·公告汇总串·X岛路标

No.68758003 - 一个本地NMB数据阅读器 - 技术宅


回应模式
No.68758003
名 称
E-mail
标题
颜文字
正文
附加图片
•程序语言、压制投稿、视频制作以及各计算机领域的技术问题
•我觉得还是CSDN靠谱一点
•本版发文间隔为15秒。

一个本地NMB数据阅读器 无名氏 2026-06-01(一)18:07:05 ID:SLDLTVR [举报] [订阅] [只看PO] No.68758003 [回应] 管理
最开始只是想给大洛山的串留个档,然后

下都下了,整个本地阅读器吧( ´∀`)
整都整了,做个服务器版吧,手机就也能看了( ゚∀゚)
做都做了,把检索也加上吧( ゚ 3゚)
加都改加了,把整个流程改完整点吧(ゝ∀・)

现在觉得整这么麻烦为啥我不直接上岛看了(*゚ー゚)

总之这是个从下载数据到双端阅读的NMB阅读器|-` )
无标题 无名氏 2026-06-08(一)13:22:18 ID:SLDLTVR (PO主) [举报] No.68805228 管理
然后肥肥正在被项目中期报告和其他一堆报告GANK・゚( ノд`゚)又得稍微失踪一下了
无标题 无名氏 2026-06-08(一)13:49:17 ID:gEGGVQn [举报] No.68805423 管理
>>No.68805131
图片不放数据库,但是串内容放数据库,哪有把图片放数据库的
我的思路是用(串首id,当前串id)做主键,然后一个表存元数据,一个表存content,然后我在想要不要把串首单独做个表,然后我还在想怎么做user_hash的匹配比较方便
无标题 无名氏 2026-06-08(一)13:51:18 ID:gEGGVQn [举报] No.68805434 管理
>>No.68805131
我记得我之前看你是元数据放json然后content入库了来着,我晚点再看看你发github的
无标题 无名氏 2026-06-08(一)13:54:48 ID:gEGGVQn [举报] No.68805453 管理
>>No.68805177
这三个我记得我在我web端都实现了,你可以去看看,然后导出放后台加回调我做过但是出bug了我没部署来着,我忘了我是放的哪版代码在github了,好像是没有回调直接硬生生导出那版(
无标题 无名氏 2026-06-08(一)14:01:09 ID:sVpgYkZ [举报] No.68805494 管理
这是啥(´゚Д゚`)
无标题 无名氏 2026-06-08(一)16:55:20 ID:SLDLTVR (PO主) [举报] No.68806777 管理
>>No.68805434
数据库里现在有个post_meta的表,存了各个串的信息

现在数据库是没有保存各个主串具体包含哪些子串的表,目录也是检测的json文件
写成这样是方便手改。主要因为肥很粗心(*´д`),另外现在还没有个标准的格式啥的,各个串分类、标签啥的也没有标准,所以就暂时留在外面了

要是之后增加一个数据库增删改查的页面的话,全都塞进数据库也行
无标题 无名氏 2026-06-08(一)17:18:06 ID:SLDLTVR (PO主) [举报] No.68807005 管理
>>No.68805453
我重新试了一下,单独的下载线程确实是有的。我中午试的时候,开始下载然后刷新页面之后,没有显示目前正在下载的串的地方,我就以为下载中断了(*´д`)刚刚摸鱼看了一眼确实下下来了

感觉一个单独显示下载状态的组件是有必要的。展示一下内容是正在下载、下载完需要更新数据库、还是其他的什么

然后缺一个下载检测。userhash填错了下载也会一直进行,但是100页之后就是重复了。

我现在下载的程序每下一页会检测这页是不是跟前一页完全重复了,完全重复了就报错。也能检测已经下完的串是否有更新,省的重复的串全都重下一遍。

然后第三个那个检测是说接到一起之后,我这块得改一下这里(=゚ω゚)=
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2026-06-08(一)17:39:33 ID:gEGGVQn [举报] No.68807203 管理
>>No.68807005
想起来了,我好像是userhash出锅了,没有应用饼干就是会一百页后重复( ゚∀。)以及我是做了下载状态支持的来着,看中间那个框,但是没写进持久化,刷新会没掉
无标题 无名氏 2026-06-08(一)17:41:04 ID:gEGGVQn [举报] No.68807215 管理
>>No.68807005
可以做个鉴权,开始下载前访问一下速报二或者三百人委员会看看结果,提示未应用饼干就回调一个提示,然后只下载前一百页
无标题 无名氏 2026-06-08(一)17:51:14 ID:41Oy55h [举报] No.68807292 管理
好牛啊(´゚Д゚`)
无标题 无名氏 2026-06-08(一)17:55:17 ID:5TM0hn0 [举报] No.68807329 管理
可以搜索关键词吗( ゚∀゚)
无标题 无名氏 2026-06-08(一)17:58:14 ID:SLDLTVR (PO主) [举报] No.68807358 管理
>>No.68807203
我觉得userhash之后也可以跟账户绑定,刷新页面就不会掉了。只要一开始鉴权保证是能用的就行
无标题 无名氏 2026-06-08(一)17:59:58 ID:SLDLTVR (PO主) [举报] No.68807369 管理
>>No.68807329
我这块的话目前只有题目和标签的关键词检索

之后可以考虑加全文的( ゚ 3゚)
无标题 无名氏 2026-06-08(一)18:41:53 ID:gEGGVQn [举报] No.68807745 管理
>>No.68807369
全文搜索我有考虑过,我的想法是manticore在个人电脑跑倒排索引,然后服务端直接在索引里面查,关键的问题是我们手头上没有所有串的数据,搜只能搜已经有的那几个串
我在想两件事,一个是岛服务器用的什么表结构,是不是更优实践,一个是三酱为什么不用manticore的倒排索引做搜索,跑完倒排索引之后加瀑布流处理对服务器开销我估了下不算大,所以我在想有没有什么暗坑
无标题 无名氏 2026-06-08(一)18:44:46 ID:gEGGVQn [举报] No.68807757 管理
>>No.68807358
自己用的话像你那样硬编码一堆东西都行,但是公开出来会冒出一堆点炒饭的(具体而言,有人可能这个饼干被碎了,或者自己删了)( ゚∀。)所以还是加强一点鲁棒性为妙
无标题 无名氏 2026-06-08(一)20:08:53 ID:gEGGVQn [举报] No.68808417 管理
po,要不你帮想几个测试场景吧,你可以大胆的点炒饭,可以大胆假设有一个几十万回复的串,可以大胆假设这个串回复的全是相同饼干或者全是不同饼干或者全是两个饼干在交替回复,可以大胆假设一个饼干交替回复50000001和68888888回复了几十万条等等,快用你的大样例狂暴轰入我新设计的架构吧(ゝ∀・)(新架构待会说)
无标题 无名氏 2026-06-08(一)20:10:49 ID:SLDLTVR (PO主) [举报] No.68808430 管理
>>No.68807745
一下就涉及知识盲区了(゚Д゚≡゚Д゚)
我搜了下manticore就是储存特定关键词在哪些串里出现,应该没理解错吧|д` )

那为啥要所有串的数据呢
每次上传新串的时候提取关键词,先在现有的关键词库里检索,查到了就把新串号追加到位置里,没检索到就创建个新的关键词这样不是正好吗( ゚∀。)

我看着感觉还挺合适的( ゚ 3゚)

>>No.68807757
゚∀゚)σ每次都鉴权也行,安全第一
无标题 无名氏 2026-06-08(一)20:20:58 ID:SLDLTVR (PO主) [举报] No.68808502 管理
>>No.68808417
这是要在什么店里点炒饭( ゚∀゚)咱要测试哪个功能
无标题 无名氏 2026-06-08(一)20:28:08 ID:gEGGVQn [举报] No.68808567 管理
>>No.68808430
具体原理是倒排索引
那你就只能搜已经下载的串里有哪些出现了这个关键词的回复了,我理解的前面肥哥是全站搜索来着( ゚∀。)

UP主: