V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  h4x3rotab  ›  全部回复第 13 页 / 共 29 页
回复总数  579
1 ... 9  10  11  12  13  14  15  16  17  18 ... 29  
2016-09-23 08:13:23 +08:00
回复了 SlipStupig 创建的主题 Python 有偿求助,求各位给点 NLP 分析思路
你列出的这些 pattern 在实际文本上能重复多少次?你觉得多少 pattern 可以召回不低于 50%的样本?标注当然要花钱,但没人说所有数据必须人工标注,显然是先实现一个基础的 parser ,再在上面迭代,十万数量级根本不算多。
2016-09-23 01:43:44 +08:00
回复了 SlipStupig 创建的主题 Python 有偿求助,求各位给点 NLP 分析思路
@menc 哪来的 pattern ?每个都是人写的, lz 发的这几条里就没 pattern
2016-09-22 20:04:02 +08:00
回复了 SlipStupig 创建的主题 Python 有偿求助,求各位给点 NLP 分析思路
另外,几千条肯定是不够的,至少也是十万级别吧
2016-09-22 20:03:21 +08:00
回复了 SlipStupig 创建的主题 Python 有偿求助,求各位给点 NLP 分析思路
规则永远比机器学习更有效,但你愿意投入多少资源去写规则?如果数据集数量稍微大一点就会发现不管写多少规则,来了新数据还是不能处理。所以说要两者互相辅助才有效。好在 lz 的需求比较具体,用我提到的方法应该可以解决超过一半的数据。
2016-09-22 10:25:14 +08:00
回复了 jason2be 创建的主题 问与答 截止到现在, 2016 年你买的最值的东西是什么?
500 收到的联想 chromebook ,从此下班不用带公司电脑回家了 233
2016-09-22 10:22:51 +08:00
回复了 TaoQAQ 创建的主题 问与答 有没有想养或养过宠物的 v 友
@SvenWong 我家一只蠢猫长得完全一样,不过我家的是萝莉
2016-09-22 10:13:44 +08:00
回复了 zhy0216 创建的主题 问与答 有没有学习高级数据结构的书?
《算法导论》 《数据结构》
2016-09-21 23:11:25 +08:00
回复了 SlipStupig 创建的主题 Python 有偿求助,求各位给点 NLP 分析思路
整体的复杂度在于,首先能否得到足够量的数据,最好是百万级别。其次,工程部分比 NLP 或者机器学习部分的工作量大,做好心理准备。
2016-09-21 23:09:28 +08:00
回复了 SlipStupig 创建的主题 Python 有偿求助,求各位给点 NLP 分析思路
1. 用分类器判断语句是否确实是降价促销
2. 用实体识别方法提取所有实体
3. 提取数字和时间,根据前后文判断数字和时间的语义,可以从正则表达式开始尝试,结合机器学习来覆盖长尾部分
2016-09-21 01:07:31 +08:00
回复了 BGYL 创建的主题 问与答 小弟将随学校参加 noi 比赛求大神指点一二
1. cpp prime 别看了,看完了用得上的还不够 1%
2. 算导基础部分看看,剩下的当速查手册吧,除非你真的大把时间
3. 算导精髓在于习题,一道题就是一篇论文,看了不见得能考到,然并卵
4. 刷题,刷各种题
@czheo 笔误,比特币是 POW
2016-09-19 21:35:59 +08:00
回复了 BMW 创建的主题 问与答 电棍什么品牌的好?功率,功能怎么选择?
三星 note7
想要简单的讲明白区块链还是不容易的。原因在于很多区块链的问题,比如 lz 提到的去中心化、去伪等,在比特币中都不是靠区块链本身实现的。

区块链本身就是一个分布式的只读日志,每个人用自己的公约来识别身份,用私钥签名证明数据所属权。所有的人(或者说大多数人)都要时刻验证新加入到区块链的数据是否有效,进行共识投票。达成共识的人会把数据写入区块链并对整个链做哈希,区块链就被延长了。机制要确保大多数人达成共识,这样区块链就可以运作。

区块链的好处在于:参与者在验证新数据的时候不需要扫描整个区块链,只需要根据上一个块的哈希就可以快速验证。在分布式系统中每次都验证全部数据是不可行的,所以区块链本质上提高了效率。

这个流程非常简单,但有许多没解决的问题,关键在于如何在延长区块链的时候达成共识:谁可以参与共识流程?如果每个人都可以随意参与,如何决定每个用户的投票权?假设每个用户都拥有同样的投票权,如何防止敌人伪造出大量僵尸用户?

如果参与的人不是固定的,那么为了解决这个问题就产生了 POW 和 POS 两种机制来分配投票决定权,其中 POS 就是比特币采用的方式,以此衍生出来了整套生态。

如果参与者是固定的,分配投票权不是问题了,但如何确定参与者就是另一个问题,除非继续中心化的分配身份,比如采用类似 CA 的机制。同时为了保证投票不被一方垄断,还要仔细设计投票机制,确保投票权分配合理,让参与者互相制衡。此处的关键就是,每个用户为了确保自身的利益都要保证其他参与者不作弊。

因为区块链的哈希特征,每个参与者都必须在最后的一个块上继续延长,保证了区块链的只读。所以理论上所有的数据都被公示,不可能发生通过篡改实现的作弊。所以问题的关键就在于写入区块链的共识过程了。解决了以上问题,区块链就基本可以很好的运作了。
2016-09-19 12:49:00 +08:00
回复了 qwerasd 创建的主题 程序员 劝退 5 个人真的惊动了马爸爸吗?
远离办公室政治,欢迎加入谷歌
http://www.google.cn/intl/zh-Hant/about/careers/
2016-09-09 19:50:22 +08:00
回复了 vincixu 创建的主题 编程 有木有一起学习 windows 驱动开发( WDF)的?拉群共同进步?
关注
2016-09-08 20:13:29 +08:00
回复了 dante823 创建的主题 硬件 关于技嘉 GA-X99-SLI 上黑苹果的 alc1150 声卡驱动。
@Tink 求分享配置

@dante823 晚点把 efi 发给你吧,但是应该不只是 efi ,系统目录下的一些东西我也改过了
2016-09-04 14:35:53 +08:00
回复了 dante823 创建的主题 硬件 关于技嘉 GA-X99-SLI 上黑苹果的 alc1150 声卡驱动。
声卡我记得瞎 b 捣鼓就好了,但是 hdmi 音频是打死也没搞定
2016-09-04 14:31:22 +08:00
回复了 wodesuck 创建的主题 问与答 用 gtest 有办法测试中间过程的返回值吗?
当然应该一个一个函数测试,如果调用到了不想测的部分就 mock 掉
2016-08-22 08:53:00 +08:00
回复了 loveuqian 创建的主题 问与答 想请教下黑苹果的性能
上 titan x 啊,除了最新的驱动还没到,别的什么显卡跑不起来的
1 ... 9  10  11  12  13  14  15  16  17  18 ... 29  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   991 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 21:29 · PVG 05:29 · LAX 13:29 · JFK 16:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.