清华系“仓颉”来了！大模型造字7天交付超40套，客户成本大降80%-麦子文章

声明:本文来自于微信公众号量子位，作者:白小交，授权站长之家转载发布。

大模型如何落地?怎么落地?成为今年科技领域的头号主题。

在一个不为大多数人所知道的造字赛道中，这家清华创业公司——「图形起源」悄然实现商业变现:

帮助字体公司降低80%成本，提速10倍以上。Canva可画上最受欢迎的前100套中文字体，大部分都是用他们的算法生成的。

这个赛道足够小也确实刚需，设计公司、字体公司苦版权费用久矣。

而他们凭借原本积累的图形学与AI的技术优势，实现了人工所不能及的效率和精度。

来看看他们是如何发现以及靠AI造字来赚钱的。

靠AI造字赚钱，提速10倍以上

首先来了解一下什么是字体生产?

传统的字体生产流程，往往需要设计师用手写的方式来完成整套字体的制作，（一套字体最多近3万字）并且在初稿完成后，还需要人工团队进行逐字校对。

因为纯人工操作，这样一套流程下来不仅周期长，往往需要一个季度。对于字体公司来说，这是一笔不小的成本支出。

与此同时，也正因为人工，单个字体字形质量风格等细节上不好把控。

对于设计公司来说，制作过程中的高成本，也导致了商用版权字体采买费用的高昂。

正是在同客户交流时，图形起源团队发现了这一行业痛点，耗时数月打造了一套字体生产线。

这不是简单应用一个大模型就能直接生成的。字体设计最大的区别在于它是矢量图，可以无限放大而不失真。而目前AI生成的图通常是位图，有像素限制。

如何让AI生成矢量图，理解字体的锚点和矢量曲线的含义，成为核心的技术难点。

创始人史海天分享了他们的解决思路，整个流程分为四个阶段:

首先，用一个传统的Diffusion模型会生成位图;

其次，用第二个超分辨率模型，把字体位图的分辨率提到最高;

然后，用一种独特的算法，让AI能够理解什么是“好的矢量设计”，设计第三个模型，以这种“好“的审美作为优化目标，用训练后的模型把位图转化成矢量图;

最后，训练一个专门检查错别字和字形结构的模型。

除此之外，他们还计划开发笔画拆分模型。

基于这样的模型，他们能实现人类所不能达到高效和高质量。

比如基于AI超分技术和AI矢量化，像各种笔画、偏旁部首的边缘细节处理，能禁得起任意放大维度，设计师能在海报等场景中使用。

客户只需要完成前199个字的操作，AI就能在两天内训练并生成数万字。并且也不限于简体，像繁体字、生僻字，日文韩文拉丁这样的多语种也OK。

在准确率上，简单字形（笔画<15）单次生成的平均生成错字率小于1%，复杂字形(笔画≥15)单次生成的平均生成错字率小于5%，已经远高于人工审校的准确度。

现在他们还打造了一个SaaS平台，整个交付过程都可以在线上进行。客户能随时查看进度，或自己完成全部生产过程，不用图形起源的人工干预。

据透露，目前他们已经生成了346套字体，累计4680244个字。

来自图形起源

图形起源成立于2020年底，是由当时清华大学车辆学院毕业生史海天，读硕士休学时候创办。

在此之前，他们主要做3D创作引擎，并完成了三轮融资，受到像五源资本、真格基金等机构的青睐。当时他们的愿景是，希望在未来建立一个大众化的3D内容创作工具，以及一个普通人愿意在其中生活的社交世界。

不过现在史海天回忆当时没有找到很好的变现场景，如今大模型的到来，带给他们全新的机遇。

当时他们花了很长时间和资金来验证这件事情。史海天透露，他们当时训了两个大模型，一个用来识别，一个用来生成，训练目标是AI生成的字体让AI分辨不出。

不过这个行业的优点在于，字体数据是比较全的，比如一套字能喂给AI一半字，让AI可以生成剩下一半字。

最后他们也实现了交付级别的生成效果，目前一周能完成超过40套字体的交付，相当于效率提升了几百倍。

目前公司主要有两个主营业务。

中文字库扩写，也就是客户给参考字体文件，图形起源AI先进行一波学习，然后生成风格统一的字形。

整个流程都是在SaaS平台上进行，平台上支持人工校对、二次学习、批量生成、人工二次筛选等工作，以进一步降低生成字体的错字率。

跨语种风格迁移。顾名思义，就是根据任意语种任意字体，来生成同种风格的任意语种任意字形。

目前他们能够稳定生成中日韩拉丁字母、希腊字母、西里尔字母，常见符号数字等，并且已经在小米应用商店有售卖。

而像藏文、阿拉伯文等小语种文字还在内测阶段。

最后想说，虽然现在看各个大厂都在卷生产力场景，市场很卷。但是具体到各个细分场景下，大企业也许就没有那么多的资金精力去投入。

那些场景看上去需求有限，但确实同样也是强刚需，也能实现商业变现。比如字体，比如排版。

对于创业公司来说，就是个不错的切入点。图形起源就是一个。

如今大模型应用如火如荼，到底还是看能不能解决实际问题。这条真理已经是再明确不过了。