V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
FelixBoom
V2EX  ›  程序员

有朋友在追一科技或者其他国内的 NLP 创业公司待过的嘛,想问点事儿

  •  
  •   FelixBoom · 2023-02-06 13:48:28 +08:00 · 2556 次点击
    这是一个创建于 693 天前的主题,其中的信息可能已经有所发展或是发生改变。

    ChatGPT 都通过谷歌 l3 面试了==。想了解了解国内自然语言这方面的进展啊,感觉最近几年要不就是停滞要不就是搞元宇宙才冒出来一下... 有朋友在追一科技或者其他国内的 NLP 创业公司待过的嘛,想问问有亲身经历的朋友,国内的同类公司或者实验室项目的阻碍在哪儿。 谢谢啦,不胜感激!

    22 条回复    2023-02-10 15:30:44 +08:00
    mk3s
        1
    mk3s  
       2023-02-06 15:04:37 +08:00   ❤️ 1
    我同学哈工大研究生毕业去了追一,然后就跳到百度了,据说追一有股权,但是少得可怜,她说搞 ai 大部分难都难在落地,且国内的公司都在追求盈利,虽然无可厚非,但就和这个公司的名字一样,永远是追随者,无法成为领头羊
    monkeyzsf
        2
    monkeyzsf  
       2023-02-06 15:31:46 +08:00
    曾经的某智能客服,数据统计属于其他( 5 年前):
    很难落地盈利,甚至于 AI 业务是靠着其他业务来养活的。
    很搞笑的是经常要求 1 周做个 demo 出来给客户看,去谈合作啥的。(不到 10 个人的技术团队 1 周能做出啥来)
    国内大部分都在做垂直细分领域的智能,比如某个做淘宝电商女装的智能客服,大部分公司都是基于海量数据来提炼答案,也就是需要所谓的知识工程师录入问答数据啥的,科大讯飞早期也是这样搞的,录入员很多很多,现在不清楚了
    lrigi
        3
    lrigi  
       2023-02-06 15:38:04 +08:00 via iPhone
    没呆过 nlp 公司,甚至不是做 nlp 方向的。
    指望创业公司不如指望大厂,但感觉大厂缺少一点砸钱探索未来的魄力,只能跟人家后面走。
    GPT3 成本快 3000w 美元,一万张 GPU ,国内有这个资源的屈指可数。
    机器之心看到在这方面国内已经落后两年了,智源这种最有希望出一个吧(国内 nlp 危
    20112019
        4
    20112019  
       2023-02-06 17:13:19 +08:00   ❤️ 4
    搞过 nlp,目前国内对于 ai 整体来看,倾向于追(或者说抄),毕竟模型或者大致的 idea 开源之后,再自己搞点魔改,然后用业务数据跑跑就能用,为啥要自己从头到尾搞?目前的症结在于小公司有胆量,可能也有点技术,但是一没数据,二没钱或者说钱不够。大公司要么躺平怕危险目前核心业务,要么不愿意花钱养着高成本团队做短期出不了效益的事。说实话,国内做 ai 要感谢这一波 aigc 和 chatgpt ,直接替很多公司续了命,毕竟美国那边认可了烧钱能出成果,那么国内这帮创业公司就会被认可烧钱的意义,不然也是一地鸡毛。
    FelixBoom
        5
    FelixBoom  
    OP
       2023-02-06 17:24:13 +08:00
    @mk3s 感觉国内的投资逻辑和美国很不一样,这对这种前期难商业化的公司头疼的很.. 不过百度准备下个月发的那个,谨慎看好==,AIGC 那个就够烂了..
    FelixBoom
        6
    FelixBoom  
    OP
       2023-02-06 17:27:51 +08:00
    @201120 小公司没数据这个事是不是很要命啊,也想问问目前有啥值得关注的 npl 的初创公司或者团队嘛
    FelixBoom
        7
    FelixBoom  
    OP
       2023-02-06 17:29:09 +08:00
    @monkeyzsf 这也是在追一吗
    20112019
        8
    20112019  
       2023-02-06 17:34:39 +08:00
    @FelixBoom ai 界有个词,叫大力出奇迹。算法能够提高上限,但是模型的下限是数据确定的。为啥国内很多做垂直领域的 ai ,他们难道不想做通用的吗,没钱没数据才是关键。尤其是通用大模型,数据量少了,你怎么覆盖边界情况,想想也不可能。初创不清楚,目前已经换到工业互联网赛道。不过整体不看好国内 nlp 方向,倒是觉得 cv 方向有点东西。
    gezimonkey
        9
    gezimonkey  
       2023-02-06 17:50:16 +08:00   ❤️ 3
    国内 NLP 环境很差,小公司没钱没数据,起步都很费劲,并且中文环境现在能讲的真话太少,导致大量反讽,识别很差
    mk3s
        10
    mk3s  
       2023-02-06 18:05:27 +08:00
    @FelixBoom 国内目前大部分人都还在为生活奔波,长期目标持续投入只停留在国家战略层面,也许等我们都老了,可能就稍微有点改观了呢,还是先从自己开始改变吧,说不定就能影响到周遭然后获得意想不到的成就呢~
    monkeyzsf
        11
    monkeyzsf  
       2023-02-06 18:23:13 +08:00
    @FelixBoom 不是,同行,现在死掉了
    dlsflh
        12
    dlsflh  
       2023-02-06 19:09:11 +08:00 via Android
    内容农场能训练出什么好模型?
    opentrade
        13
    opentrade  
       2023-02-06 21:37:21 +08:00 via Android
    @gezimonkey 观点新颖
    David1119
        14
    David1119  
       2023-02-06 23:31:08 +08:00
    ChatGPT 一出,搞 NLP 的估计想死了,学了多年的知识分分钟被迭代了
    FelixBoom
        15
    FelixBoom  
    OP
       2023-02-07 16:53:29 +08:00
    @20112019 确实,无限的数据和钱的苦功.。CV 至少一眼能看到落地场景,通用 AI 太难找钱了..
    FelixBoom
        16
    FelixBoom  
    OP
       2023-02-07 16:54:18 +08:00
    @gezimonkey 起步大概需要个什么规模的钱和数据啊
    FelixBoom
        17
    FelixBoom  
    OP
       2023-02-07 16:56:56 +08:00
    @monkeyzsf 所以你们原来是想做通用然后调整到智能客服这个垂直领域吗,还是一开始就
    FelixBoom
        18
    FelixBoom  
    OP
       2023-02-07 16:57:40 +08:00
    @David1119 物理学不存在了.JPG ==,
    gezimonkey
        19
    gezimonkey  
       2023-02-08 09:48:18 +08:00
    @FelixBoom 几百万人民币总是要有的,数据的话就不好说了
    FelixBoom
        20
    FelixBoom  
    OP
       2023-02-10 15:28:34 +08:00
    @mk3s 冒昧,能不能问问你这位从追一去百度的同学的联系方式啊,myfelix177 这是我微信。
    FelixBoom
        21
    FelixBoom  
    OP
       2023-02-10 15:29:57 +08:00
    @20112019 想详细请教下,myfelix177 这是我微信~
    FelixBoom
        22
    FelixBoom  
    OP
       2023-02-10 15:30:44 +08:00
    @monkeyzsf 想详细了解些细节啊,可否聊聊,myfelix177 这是我微信~
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1015 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 19:53 · PVG 03:53 · LAX 11:53 · JFK 14:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.