內(nèi)容提要:
引言
PART1-OpenAI相關(guān)專利
PART2-專利檢索
PART3-專利分析
結(jié)語(yǔ)
(本文共計(jì)4500+字,建議閱讀時(shí)間20分鐘)
>>>引 言
2023年1月,國(guó)家知識(shí)產(chǎn)權(quán)局推出全新專利業(yè)務(wù)辦理系統(tǒng),以更優(yōu)化的設(shè)計(jì)、更智能的功能、更簡(jiǎn)化的流程,為專利申請(qǐng)、PCT國(guó)際專利申請(qǐng)、外觀設(shè)計(jì)國(guó)際申請(qǐng)等業(yè)務(wù)提供高效便捷的“一站式”辦理平臺(tái)。
圖片來(lái)源:專利業(yè)務(wù)辦理系統(tǒng)
https://cponline.cnipa.gov.cn/
其中,從專利業(yè)務(wù)辦理系統(tǒng)的“專利審查信息查詢模塊”可以進(jìn)入“專利檢索及分析系統(tǒng)”。新版專利檢索及分析系統(tǒng)實(shí)現(xiàn)了對(duì)原公眾檢索系統(tǒng)功能和數(shù)據(jù)的全面覆蓋和升級(jí),進(jìn)一步擴(kuò)充了專利數(shù)據(jù)資源,優(yōu)化了檢索應(yīng)用功能,豐富了專利分析模型,有利于提升社會(huì)公眾專利檢索分析便利化水平。
下面我們將以ChatGPT相關(guān)專利檢索為例,對(duì)新版專利檢索及分析系統(tǒng)的功能和數(shù)據(jù)進(jìn)行實(shí)測(cè)。
>>> PART 1
OpenAI相關(guān)專利
2023年伊始,由美國(guó)人工智能研究實(shí)驗(yàn)室OpenAI研發(fā)的人工智能聊天機(jī)器人程序ChatGPT火爆全球。3月14日晚,OpenAI正式推出ChatGPT4.0版本,并宣布已經(jīng)與多家企業(yè)合作,再度引發(fā)市場(chǎng)熱議。
據(jù)資料[1]顯示,OpenAI目前擁有一項(xiàng)已頒發(fā)的美國(guó)專利11521611(公告號(hào)US11521611B2.以下簡(jiǎn)稱D1)和一項(xiàng)已公開(kāi)的美國(guó)專利申請(qǐng)17/152338(公開(kāi)號(hào)US2022229999A1.以下簡(jiǎn)稱D2)。雖然這兩篇專利文獻(xiàn)顯示的申請(qǐng)人均為Palo Alto Research Center(PARC),并非OpenAI,但在調(diào)查其中的一個(gè)發(fā)明人Jesse Vig后,筆者發(fā)現(xiàn):在PARC公司網(wǎng)站上存在幾篇關(guān)于他與OpenAI合作的文章,表明他曾經(jīng)把自己發(fā)明的一些技術(shù)運(yùn)用于OpenAI的GPT相關(guān)研發(fā)??梢酝茰y(cè),資料中顯示的兩件美國(guó)專利文獻(xiàn)與OpenAI相關(guān)是具有非常大可能性的。
?
D1
USING ConVERSATION STRUCTURE AND ConTENT TO ANSWER QUESTIONS IN MULTI-PART onLINE INTERACTIONS
使用會(huì)話結(jié)構(gòu)和內(nèi)容來(lái)對(duì)多方在線交互中問(wèn)題進(jìn)行回答
D1涉及用于確定對(duì)多方對(duì)話中問(wèn)題的答案的計(jì)算機(jī)實(shí)現(xiàn)的方法,即在人們通過(guò)計(jì)算機(jī)進(jìn)行多方會(huì)話時(shí),接收這些具有多個(gè)節(jié)點(diǎn)的多方會(huì)話;將每個(gè)節(jié)點(diǎn)解析為多個(gè)元素;識(shí)別出其中包含問(wèn)題的元素;構(gòu)建會(huì)話節(jié)點(diǎn)列表,標(biāo)識(shí)出各個(gè)節(jié)點(diǎn)之間的關(guān)系;然后基于會(huì)話節(jié)點(diǎn)列表產(chǎn)生出對(duì)所述問(wèn)題的至少一個(gè)答案。
?
D2
SERVICE PLATFORM FOR GENERATING CONTEXTUAL, STYLE-ConTROLLED RESPonSE SUGGESTIONS FOR AN INCOMING MESSAGE
針對(duì)傳入消息生成適應(yīng)上下文且風(fēng)格受控的回復(fù)建議的服務(wù)平臺(tái)
D2涉及一種自動(dòng)生成對(duì)傳入的自然語(yǔ)言通信的建議響應(yīng)的裝置,所述裝置包括分類器、生成式自然語(yǔ)言模型和至少一個(gè)處理器。所述分類器已經(jīng)被訓(xùn)練來(lái)預(yù)測(cè)由自然語(yǔ)言通信表現(xiàn)出的一個(gè)或多個(gè)風(fēng)格屬性,所述生成式自然語(yǔ)言模型已經(jīng)被訓(xùn)練來(lái)生成對(duì)自然語(yǔ)言通信的響應(yīng),所述至少一個(gè)處理器執(zhí)行來(lái)自至少一個(gè)存儲(chǔ)器的計(jì)算機(jī)程序代碼,使所述裝置能接收傳入的自然語(yǔ)言通信,并借助經(jīng)訓(xùn)練的分類器確定傳入的自然語(yǔ)言通信的不同語(yǔ)言風(fēng)格,然后根據(jù)經(jīng)訓(xùn)練的生成式語(yǔ)言模型來(lái)生成對(duì)應(yīng)的語(yǔ)言風(fēng)格。
下面我們就參考這兩篇專利文獻(xiàn),利用國(guó)家知識(shí)產(chǎn)權(quán)局新版“專利檢索及分析系統(tǒng)”來(lái)檢索和分析ChatGPT相關(guān)專利。
>>> PART 2
專利檢索
1、主觀關(guān)鍵詞 vs 核心關(guān)鍵詞
眾所周知,在知道專利申請(qǐng)?zhí)柣蚬_(kāi)號(hào)的前提下進(jìn)行檢索是最簡(jiǎn)單的。例如,直接通過(guò)常規(guī)檢索,輸入“US11521611B2”,便可找到該專利文獻(xiàn)。
可是,通常我們進(jìn)行專利檢索前是不知道專利號(hào)或?qū)@暾?qǐng)?zhí)柕?,往往需要利用關(guān)鍵詞檢索來(lái)找出目標(biāo)信息。一般情況下,很多人在檢索時(shí)習(xí)慣用主觀的關(guān)鍵詞進(jìn)行檢索,但這對(duì)于專利檢索來(lái)說(shuō)很容易出現(xiàn)檢索結(jié)果噪聲大的情況,如無(wú)關(guān)數(shù)據(jù)多、整體關(guān)聯(lián)度不高等。因此,為了全面解析專利技術(shù)方案,需要總結(jié)技術(shù)方案的創(chuàng)新點(diǎn)——客觀分析并提取重點(diǎn)檢索要素——確定核心關(guān)鍵詞。
例如,對(duì)于D2.我們首先從摘要的“一種自動(dòng)生成對(duì)傳入的自然語(yǔ)言通信的建議響應(yīng)的裝置”中,主觀提取出“Automatically generate(自動(dòng)生成)、Natural language(自然語(yǔ)言)”等關(guān)鍵詞;然后我們點(diǎn)擊“詳覽”進(jìn)入該專利的顯示界面。如圖1所示,我們先點(diǎn)擊全文文本進(jìn)入專利的權(quán)利要求和說(shuō)明書(shū),然后點(diǎn)擊文本左上角“高亮”輸入關(guān)鍵詞,再點(diǎn)擊“高密”查看這些詞的出現(xiàn)頻率來(lái)確認(rèn)這些主觀的關(guān)鍵詞的重要性,進(jìn)而確定該專利的核心關(guān)鍵詞。
圖1
接下來(lái)我們通過(guò)高級(jí)檢索,輸入已確定的核心關(guān)鍵詞,進(jìn)行進(jìn)一步檢索。(如圖2所示)
步驟1:在摘要位置輸入關(guān)鍵詞“automatically generate”;
步驟2:點(diǎn)擊前面的“摘要”,該關(guān)鍵字會(huì)被放到編輯區(qū)中;
步驟3:使用連接符“OR”(具體根據(jù)需求使用不同連接符)帶上所有關(guān)鍵詞;
步驟4:再重復(fù)步驟1至步驟3.直到把所有關(guān)鍵詞都添加進(jìn)檢索式;
步驟5:點(diǎn)擊最下面的檢索,進(jìn)行相關(guān)信息檢索。
圖2
Tips:
若檢索的關(guān)鍵詞含空格時(shí),則需要用引號(hào)把該關(guān)鍵詞括起來(lái),如“natural language”不加引號(hào)則系統(tǒng)將按natural OR language進(jìn)行檢索;
檢索式中同級(jí)算符必須一致,同時(shí)需要用括號(hào)來(lái)區(qū)分不同級(jí)別,以表示括號(hào)內(nèi)的組合優(yōu)先運(yùn)算。
點(diǎn)擊檢索后,系統(tǒng)一共檢索出了7344條相關(guān)數(shù)據(jù)。切換成列表快速瀏覽標(biāo)題后,能看到雖然其中確實(shí)包含與ChatGPT相關(guān)的文獻(xiàn),但也存在較多其他領(lǐng)域的文獻(xiàn)。而且,筆者從以上關(guān)鍵詞檢索結(jié)果中,并沒(méi)有發(fā)現(xiàn)D1.可見(jiàn),關(guān)鍵詞檢索仍然具有局限性,這是由于專利文獻(xiàn)中的術(shù)語(yǔ)存在語(yǔ)言種類和表達(dá)方式的不同,有時(shí)難以準(zhǔn)確表達(dá)技術(shù)手段以及難以區(qū)分技術(shù)領(lǐng)域。因此,我們可以考慮利用分類號(hào)進(jìn)行檢索。
2、IPC分類號(hào)檢索 vs CPC分類號(hào)檢索
眾所周知,國(guó)際專利分類號(hào)(IPC)是根據(jù)1971年簽訂的《國(guó)際專利分類斯特拉斯堡協(xié)定》編制的,由世界知識(shí)產(chǎn)權(quán)局(WIPO)負(fù)責(zé)維護(hù)。而聯(lián)合專利分類(Cooperative Patent Classification,簡(jiǎn)稱CPC)是歐洲專利局(EPO)和美國(guó)專利商標(biāo)局(USPTO)聯(lián)合開(kāi)發(fā)的專利分類系統(tǒng),于2013年1月1日正式啟用。例如,專利文獻(xiàn)扉頁(yè)上的著錄項(xiàng)目代碼58就表示CPC分類號(hào)。
CPC體系為實(shí)現(xiàn)與IPC的兼容,大體上沿用了IPC的分類規(guī)則。而且CPC在IPC的基礎(chǔ)上,對(duì)原有IPC條目涉及的技術(shù)主題進(jìn)行了再細(xì)分,同時(shí)條目中也增加了許多 IPC中沒(méi)有提及的新技術(shù)所涉及的技術(shù)主題,所以CPC較 IPC而言,能夠更精準(zhǔn)地表達(dá)發(fā)明構(gòu)思。選擇正確的CPC分類號(hào)進(jìn)行專利文獻(xiàn)的檢索,常??梢赃_(dá)到事半功倍的效果。
筆者通過(guò)分析D1和D2發(fā)現(xiàn),兩篇文獻(xiàn)的CPC分類號(hào)都包括G06F40/56(自然語(yǔ)言生成)。ChatGPT是AIGC(AI Generated Content)的一種應(yīng)用,GPT是“GenerativePre-trained Transformer”的縮寫(xiě),意思是“生成式預(yù)訓(xùn)練變換模型”。因此,可以認(rèn)為G06F40/56(自然語(yǔ)言生成)是ChatGPT相關(guān)專利的對(duì)應(yīng)分類號(hào)。
于是筆者通過(guò)檢索式“CPC分類號(hào)=(G06F40/56)”進(jìn)行檢索,結(jié)果獲取到3168條相關(guān)文獻(xiàn)。而利用“IPC分類號(hào)=(G06F40/56)”的方式進(jìn)行檢索,只能找到1166條相關(guān)文獻(xiàn),存在較多漏檢。通過(guò)對(duì)比這兩種檢索式得到的文獻(xiàn)標(biāo)題,筆者發(fā)現(xiàn)根據(jù)CPC分類號(hào)檢索出的文獻(xiàn)大多都更接近于檢索目標(biāo)。
>>> PART 3
專利分析
對(duì)于利用CPC分類號(hào)檢索到的3168條相關(guān)專利文獻(xiàn),筆者通過(guò)點(diǎn)擊加入分析庫(kù)將其放進(jìn)所創(chuàng)建的分析庫(kù)中(如圖3所示):
圖3
如果是首次加入分析庫(kù),則需要?jiǎng)?chuàng)建一個(gè)新的分析庫(kù)。創(chuàng)建完畢后,可繼續(xù)尋找相關(guān)文獻(xiàn)并進(jìn)行勾選,然后點(diǎn)分析庫(kù),找到自己創(chuàng)建的分析庫(kù),點(diǎn)擊追加到分析庫(kù)中(如圖4所示):
圖4
當(dāng)分析庫(kù)構(gòu)建完成后,檢索者便能對(duì)分析庫(kù)中的文獻(xiàn)進(jìn)行分析。
可通過(guò)以下方式進(jìn)入分析界面:
直接點(diǎn)擊分析庫(kù)中“進(jìn)入分析”;
或在瀏覽界面最上方,點(diǎn)擊“分析”,在彈出對(duì)應(yīng)的下拉菜單中選擇不同的分析方式進(jìn)入分析。
在分析界面中,檢索者可以通過(guò)左邊的菜單欄選擇更有針對(duì)性的分析類型,并通過(guò)選擇不同圖表形式來(lái)進(jìn)行分析(如圖5所示):
圖5
1、申請(qǐng)人分析
例如,檢索者可以點(diǎn)擊申請(qǐng)人分析中的“申請(qǐng)人趨勢(shì)分析”,然后選擇折線圖。從圖6可以看出,IBM(最上面的藍(lán)色折線)的相關(guān)專利數(shù)量領(lǐng)先于其他公司。眾所周知,從20世紀(jì)50年代開(kāi)始,IBM就一直是人工智能領(lǐng)域的先驅(qū)者,它一直專注于人工智能領(lǐng)域,其中超級(jí)電腦”沃森(watson)”是最知名的AI項(xiàng)目之一。“沃森”存儲(chǔ)了海量的數(shù)據(jù),可以學(xué)習(xí)語(yǔ)言和人類知識(shí),而且擁有一套邏輯推理程序,可以推理出它認(rèn)為最正確的答案。所以,IBM在該領(lǐng)域?qū)@麛?shù)量遙遙領(lǐng)先是不足為奇的。
圖6
Tips:
有的折線往往并不是檢索者關(guān)注的重點(diǎn),可以選擇把它隱藏。
如圖6原本的分析圖會(huì)有一條明顯高于其他特定申請(qǐng)人的折線,該折線對(duì)應(yīng)的是“其它”圖例,表示申請(qǐng)數(shù)量居后的多個(gè)申請(qǐng)人的集合。為了方便觀察申請(qǐng)數(shù)量居前的特定申請(qǐng)人圖例,檢索者可以設(shè)置隱藏這個(gè)“其它”圖例。
進(jìn)一步點(diǎn)擊表格,檢索者就能通過(guò)數(shù)據(jù)了解到具體的申請(qǐng)人專利數(shù)量。如圖7所示,我們看到微軟位列第二。據(jù)報(bào)道,微軟于2019年首次注資OpenAI后,于2020年7月向OpenAI投資10億美元,在Azure云平臺(tái)上提供OpenAI技術(shù)。2021年微軟再次投資20億,Azure OpenAI集成GPT-3模型,可以直接調(diào)用相關(guān)API。2023年1月24日,微軟宣布與OpenAI再次擴(kuò)大合作關(guān)系,追加投資100億,加速人工智能領(lǐng)域的技術(shù)突破與轉(zhuǎn)型。本輪投資后,微軟將獲得OpenAI 75%的利潤(rùn)分紅權(quán)直到收回投資,之后微軟將擁有OpenAI 49%分紅權(quán)。通過(guò)專利檢索,筆者發(fā)現(xiàn):微軟在上述一系列投資的同時(shí),也在積極開(kāi)展該領(lǐng)域的專利布局。
筆者還注意到,最近因推出“文心一言”而被推上風(fēng)口浪尖的百度,在該領(lǐng)域也有較多專利申請(qǐng),能排到第10名左右。
圖7
然后,筆者點(diǎn)擊前面的“+”,就會(huì)發(fā)現(xiàn)相對(duì)而言排名靠前的企業(yè)。百度在該領(lǐng)域的專利布局晚了很多,自2019年開(kāi)始才有相關(guān)文獻(xiàn)(如圖8所示),這體現(xiàn)出百度在該領(lǐng)域的研發(fā)處于追趕的狀態(tài)。雖然百度現(xiàn)在發(fā)布“文心一言”有一點(diǎn)兒趕鴨子上架的感覺(jué),但筆者相信只要持續(xù)投入,作為后發(fā)者的百度也有可能產(chǎn)出屬于中國(guó)人自己的ChatGPT。
圖8
2、發(fā)明人分析
如圖9所示,在分析欄中選擇發(fā)明人分析,從“發(fā)明人趨勢(shì)分析”中點(diǎn)擊表格,就能從排名靠前的發(fā)明人中看到,百度的首席技術(shù)官王海峰(WANG HAIFENG)參與了百度大部分專利。
進(jìn)而筆者通過(guò)互聯(lián)網(wǎng)上搜索的信息得知,王海峰在2019年5月被任命為百度集團(tuán)首席技術(shù)官,9月百度智能云事業(yè)群組(ACG)融入王海峰負(fù)責(zé)的CTO體系。2020年,王海峰將原AIG(AI技術(shù)平臺(tái)體系)、TG(基礎(chǔ)技術(shù)體系)和ACG(百度智能云事業(yè)群組)整體整合為人工智能體系(AI Group,AIG),由王海峰整體負(fù)責(zé)。而在這之后,百度就開(kāi)始在自然語(yǔ)言生成領(lǐng)域上奮起直追??梢?jiàn),百度的AI技術(shù)與王海峰是息息相關(guān)的。
圖9
3、區(qū)域分析
如圖10所示,在分析欄中選擇區(qū)域分析,從“區(qū)域構(gòu)成分析”的圖像中可以看出,美國(guó)地區(qū)申請(qǐng)人的相關(guān)專利占比已經(jīng)超過(guò)二分之一,而中國(guó)地區(qū)申請(qǐng)人的相關(guān)專利雖然相比其他國(guó)家位于前列,但是與美國(guó)相比仍然有很大差距。
圖10
為了進(jìn)一步查看中國(guó)地區(qū)不同申請(qǐng)人的申請(qǐng)情況,如圖11所示,筆者選擇“區(qū)域申請(qǐng)人分析”,然后點(diǎn)擊表格,找到“CN”,點(diǎn)擊前面的加號(hào),就能打開(kāi)查看中國(guó)地區(qū)不同申請(qǐng)人的申請(qǐng)量??梢钥吹?,在中國(guó)地區(qū),百度在該領(lǐng)域的申請(qǐng)量最高,其次是華為、騰訊等。由此可知,國(guó)內(nèi)的幾家大廠已經(jīng)開(kāi)始在中國(guó)進(jìn)行專利“跑馬圈地”,至于誰(shuí)率先能在市場(chǎng)站穩(wěn)腳跟,就要看誰(shuí)能先一步將技術(shù)落地了。
圖11
>>> 結(jié) 語(yǔ)
“ChatGPT”接續(xù)“元宇宙”、“web3”成為了AI圈的熱門(mén)關(guān)鍵詞,掀起了科技界的一場(chǎng)狂潮。俗話說(shuō),“外行看熱鬧,內(nèi)行看門(mén)道”,借助國(guó)家知識(shí)產(chǎn)權(quán)局新版“專利檢索及分析系統(tǒng)”,知識(shí)產(chǎn)權(quán)工作者不僅可以“看熱鬧”,還能有效“跟蹤”相關(guān)領(lǐng)域的最新研發(fā)方向,了解國(guó)內(nèi)外主要競(jìng)爭(zhēng)對(duì)手及其專利布局情況。
總之,通過(guò)檢索和分析相關(guān)專利文獻(xiàn),企業(yè)就可以做到“知己知彼”、提高自身的研發(fā)起點(diǎn)和創(chuàng)新效率、避免重復(fù)研發(fā),提前做好自身專利保護(hù)與布局規(guī)劃、搶占市場(chǎng)先機(jī),并在生產(chǎn)銷售時(shí)防范和規(guī)避侵權(quán)風(fēng)險(xiǎn)、保障企業(yè)行穩(wěn)致遠(yuǎn)。
參考資料:[1] ChatGPT: IP Strategy in the AI Space, Feb. 16. 2023. www.lexology.com
中企檢測(cè)認(rèn)證網(wǎng)提供iso體系認(rèn)證機(jī)構(gòu)查詢,檢驗(yàn)檢測(cè)、認(rèn)證認(rèn)可、資質(zhì)資格、計(jì)量校準(zhǔn)、知識(shí)產(chǎn)權(quán)貫標(biāo)一站式行業(yè)企業(yè)服務(wù)平臺(tái)。中企檢測(cè)認(rèn)證網(wǎng)為檢測(cè)行業(yè)相關(guān)檢驗(yàn)、檢測(cè)、認(rèn)證、計(jì)量、校準(zhǔn)機(jī)構(gòu),儀器設(shè)備、耗材、配件、試劑、標(biāo)準(zhǔn)品供應(yīng)商,法規(guī)咨詢、標(biāo)準(zhǔn)服務(wù)、實(shí)驗(yàn)室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術(shù)交流、新品推薦等全方位推廣服務(wù)。這個(gè)問(wèn)題就給大家解答到這里了,如還需要了解更多專業(yè)性問(wèn)題可以撥打中企檢測(cè)認(rèn)證網(wǎng)在線客服13550333441。為您提供全面檢測(cè)、認(rèn)證、商標(biāo)、專利、知識(shí)產(chǎn)權(quán)、版權(quán)法律法規(guī)知識(shí)資訊,包括商標(biāo)注冊(cè)、食品檢測(cè)、第三方檢測(cè)機(jī)構(gòu)、網(wǎng)絡(luò)信息技術(shù)檢測(cè)、環(huán)境檢測(cè)、管理體系認(rèn)證、服務(wù)體系認(rèn)證、產(chǎn)品認(rèn)證、版權(quán)登記、專利申請(qǐng)、知識(shí)產(chǎn)權(quán)、檢測(cè)法、認(rèn)證標(biāo)準(zhǔn)等信息,中企檢測(cè)認(rèn)證網(wǎng)為檢測(cè)認(rèn)證商標(biāo)專利從業(yè)者提供多種檢測(cè)、認(rèn)證、知識(shí)產(chǎn)權(quán)、版權(quán)、商標(biāo)、專利的轉(zhuǎn)讓代理查詢法律法規(guī),咨詢輔導(dǎo)等知識(shí)。
本文內(nèi)容整合網(wǎng)站:中國(guó)政府網(wǎng)、百度百科、最高人民法院、知乎、國(guó)家認(rèn)證認(rèn)可監(jiān)督管理委員會(huì)、國(guó)家知識(shí)產(chǎn)權(quán)局、市場(chǎng)監(jiān)督總局
免責(zé)聲明:本文部分內(nèi)容根據(jù)網(wǎng)絡(luò)信息整理,文章版權(quán)歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)跟我們聯(lián)系刪除并致歉!
本文來(lái)源: http://bqlw.net/news/202304/xwif_42381.html