您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

硅谷新公司SF Compute:AI算力的"Airbnb"-国际期货

不知经常往旧金山城里跑的小同伴,有没有在路边见过这样的广告:

“按周、天或小时租用H100芯片。

3.2TB/s InfiniBand高速网络,k8s / Slurm开源系统,就是这种器械。”

下面还写了一排官网地址给你“撕”。

作为全天下天生式人工智能的火热据点,旧金山街道遍布的各种AI广告早已成为它的“都会特色”。可即便云云, 这个“出租算力”的看法仍然很酷,而且是把居高临下的英伟达H100变得云云接地气,在AI圈内引起了一阵小波涛。

半年多已往,这家做算力生意的初创公司「San Francisco Compute」从名不见经传的“Underdog”来到台前。上周,Sam Altman亲弟弟Jack Altman主理的Alt Capital领投其1200万美元种子轮融资,让它的估值来到约5亿人民币(7000万美元)。

AI算力市场的“Airbnb”

我们知道,能否实时获取足量盘算资源可能会决议一家AI初创公司的成败。而通常只有规模*、资金最足够、关系最广的大公司才气确保获得所需算力。高性能AI芯片不仅成本高昂,还需要签署耐久条约,这对资金有限、营业需求多变的中小企业组成了伟大障碍。

SF Compute就是为领会决这个难题而生。它专注于为早期公司提供经济实惠、短期天真的超级盘算资源接见权限,辅助它们更高效、更经济地开发和训练AI模子。有点类似Airbnb在住宿领域的做法:通过共享和按需租赁,让用户以较低成本获取所需资源,短时间内使用大量盘算能力。

详细是通过以下两种服务模式:

1. 短期盘算资源租赁

与需要签署耐久条约(通常为1-3年)的传统提供商差异,SF Compute提供按周、按天、甚至按小时计费的短期算力租赁服务。同时具备可扩展的集群,让用户凭证现实需求来动态调整其盘算资源使用量,完全实现“GPU定制自由”。

你可以租768个H100使用一周,也可以借8个H100运行2小时。SF Compute还为 512 - 4096个GPU 的大规模预订提供有竞争力的订价。例如租赁512个H100两周只需50万美元,远低于在其它提供商那里一年1200万美元的破费。

这种以实惠价钱“发作式”接见伟大算力的天真选项,稀奇适合需要高性能盘算但不想肩负耐久财政肩负的用户。包罗资金有限、营业可能快速转变的AI初创公司,以及实验室或研究员需要壮大算力支持的短期项目等。

凭证SF Compute官网信息(下图):当前 GPU 使用价钱为2.85 美元/小时,下一个可用时间段是 8 月 4 日。从现在到明年1月5日的可用容量在逐步增添,到年底到达912个H100 GPU。

现在三个公共算力集群部署中:Angel Island 集群有192 个 H100 GPU,于去年11月上线。Bay Bridge 和 Coit Tower划分有 512 和 1024 个 H100 GPU,设计明年春季上线。

2. 盘算能力生意平台

除租赁服务外,SF Compute还在开发一个盘算能力生意平台,以使用户更便捷地按需生意盘算资源,进一步降低算力获取难度和成本。通过允许小型 AI 公司与大企业竞争来民主化高性能盘算的接见。

据悉,公司已经获得了相当于8000个H100的资源来支持这一设计。刚筹集的1200万元资金也会投入平台建设。

坐标旧金山脑谷,16人团队里三分之二当过首创人

SF Compute总部位于硅谷旧金山,办公室就设在AI公司扎堆麋集、被称为“脑谷”的Hayes Valley。2023年由Alex Gajewski(右)和Evan Conrad(左)配合确立。

Alex Gajewski任公司CEO,结业于哥伦比亚大学数学系。在最先旧金山盘算公司之前,Alex曾确立Metaphor,主导训练了一个笼罩十亿页面的大型对比模子和一个神经搜索引擎。他还在公司加速器AI Grant*批项目中施展了主要作用。职业生涯致力于削减确立*进AI模子的障碍和促进多样化的公司生态系统。

Evan Conrad在科技行业拥有厚实的职业生涯。曾在OpenAI的ChatGPT Enterprise部门短暂事情过,担任过八个月的AI Grant董事。之前团结确立了Quirk和Moder LLC并划分事情近四年。他还担任过Segment软件工程师,有Amazon和AppDetex的实习履历。

汇誉投资与华熙生物联合成立的生命科学产业基金,完成首笔对外战略投资

两人确立SF Compute的渊源也很有意思。

因成为合租室友而相识后,Alex和Evan原本是设计确立一家AI音乐初创公司。为了扩展音乐天生模子并向潜在投资者展示功效,他们联系了那时的每一家GPU提供商,以追求1个月的算力接见权限。效果被所有人见告最少购置限期是一年,用度100 万美元起步,而他们基本就拿不出100 万。

“没人愿意只卖一个月的使用权。这很好明白:若是你运营一个大型集群,*是以1到3年的条约出售并预先支付所有用度。这样风险更小,利润更高。为什么要把集群卖给 Junelark 这种险些没有资金的两人音乐初创公司,况且他们可能在条约竣事前就倒闭了?” Evan说,“不幸的是,我们就是 Junelark。我们的同伙也大多数是这种情形。”

“若是你不是那些‘神圣的少数’之一,现实上就被市场订价清扫在外。没有重大资金支持,你基本没得选择。”

追求GPU受挫的两人于是实验联系其他同样需要盘算能力的首创人,以为若是有十几家初创公司一起加入,他们就能配合肩负得起一份年度条约。

没想到短短几周内,就吸引来170家AI公司签约。看到这个重大的市场需求后,两人武断放弃了AI音乐梦想,决议成为一个专门为大规模训练义务提供超级盘算资源天真接见的GPU云供应商。

不仅是“淋过雨后方知给他人撑伞”,在算力民主化、资源共享、扶持小型实体与大企业竞争这些备受硅谷科技社区推许的理念背后,SF Compute也正中大量AI公司首创人苦于拿不到算力推进项目的痛点。

五个月前Evan Conrad在一次演讲中示意,SF Compute每个月都在把算力卖给学术实验室、研究职员、初创公司,这是其他人永远不会重视的客户。

那时他们的运营利润约为100万美元,预计在两个新集群上线后将增添10倍,到达每年1000万美元。公司的早期客户中还包罗哈佛大学和普林斯顿大学的研究实验室,以及PlayHT Inc.、Phind和Liquid AI Inc.等初创公司。

现在SF Compute在LinkedIn的关联员工为16小我私人。Evan在X发文透露,其中有10名员工都是前首创人。他们也正在招聘焦点基础设施工程师、机械学习系统工程师和产物工程师职位(有兴趣的可以关注一下)。

公司气概颇有《硅谷》电视剧里的感受。员工们编程累了,就会解物理问题来“放松”。也用文章开头那种质朴无华的方式打了许多内陆硬广。

再看几个,好比路边通告牌:

候车大厅:

以及下面这条,“为你的下一个H100账单立省2000万美元。”

用户Micheal Black说,“唯在旧金山有这样的sense。做广告的要害是领会你的客户。我在想,是的,我确实想在H100上省2000万!”

硅谷这片科技热土,向来盛产充满冒险精神的创业者和想创业的人们。通常现在一场前沿AI流动的观众里,一半以上都是人工智能相关公司首创人。

这些人对接见大量高性能AI盘算资源有着迫切的渴求,却总被财大气粗的成熟企业挤到一边,可能手握精彩的想法、手艺却无法到现实天下验证和出现。现在San Francisco Compute的泛起,让双方得以相互成就。

市场竞争与未来生长

固然,SF Compute并不是*一家提供部门盘算能力接见的公司,在市场中也面临几家颇为壮大的偕行对手。

例如Lambda Inc,最初是一家面部识别公司,厥后转向为包罗英特尔公司和国防部在内的*机构提供按需的GPU事情站、服务器和云盘算资源。更着名些的有”英伟达小弟“CoreWeave,早先是一家加密钱币挖矿公司,也转型成GPU加速云盘算服务供应商,专注于支持天生式AI和其他需要高性能盘算的义务。最近它完成了11亿美元融资,估值已达190亿美元。另外另有提供低成本算力租赁服务的Vast.ai 公司,和拥有全球漫衍GPU云及无服务器端点的RunPod公司等。

虽然竞争猛烈,但SF Compute在短至小时的租赁时间和集群使用量上的天真度、更具竞争力的价钱和专注中小企业甚至小我私人等方面,照样笼络了属于自己的特定客户群体。而未来即将推出的盘算资源生意平台,也将成为它下一大制胜优势。

SF Compute称,接下来会把团队主要工程职员翻倍至30人,进一步增强服务能力,提高市园职位。

作为投资人,Jack Altman预计会有越来越多的用例泛起:“风险投资公司和其他锁定耐久GPU生意的公司都可以行使这个平台来生意接见权。许多群体可能成为客户。”Jack Altman说,“San Francisco Compute已经睁开了许多互助洽谈,我以为这是一个异常值得看好的偏向。”