“然後再自行組合這些原子狀態的素材,組合出與原作看上去截然不同的作品。
“隻是這些原子太小了,根本無法鑒彆出於原作的直接雷同點。
“其實隻是人類鑒定抄襲的規則基礎上,繼續向下無限細分到人類無法認知為止。
“相同的設計圖案和段落是不是抄襲?相同的人物結構和大綱算不算抄襲?
“相同的抄設計元素和詩句算不算抄襲?相同的線條風格和詞組算不算抄襲?
“相同的顏色範圍搭配和詞庫範圍算不算抄襲呢?
“這樣繼續細分下去,人類學習到最後使用可能是類似的顏色範圍和詞庫。
“機器學習的深度可能比這個更加深入和細化。
“伱用人類法律鑒定抄襲的標準,去鑒定機器學習創造出來的作品,是絕對鑒定不出抄襲來的。
“類比手工織布工匠和機械化紡織機的相同,隻能算是使用了類似的棉花和顏色。
“所以為什麼人類學習不算抄襲,機器乾同樣的事情就是抄襲?
朱迪鑭笑著說:
“二哥你你可能理解錯了我的意思。
“我沒說機器學習和創造是抄襲,而人類的學習和創造不是抄襲。
“其實按照我自己的觀點,兩者都應該算是抄襲。
“就像二哥你說的,隻要鑒定抄襲的標準無限深入,所有的學習都能夠判定為抄襲。
“在這樣的基礎上,任何免費學習過彆人的藝術作品的人,都不應該創作任何以盈利為目的的作品。
“想要創造以盈利為目的的作品,本人的所有的學習資料都應該是取得了盈利授權的材料。
“因為隻要學習過,顯然就會受到或多或少影響,不然也就不能稱之為學習了。
“是否為抄襲的判斷標準,更加準確的說法是允許抄襲到什麼級彆。
“二哥可以參考微積分和相對論的邏輯來理解這個說法。
“在這樣的基礎上,現實中的人類社會和人類創作者,已經經過實際上的社會實踐和法律,默認授權了其他人類擁有特定級彆以下的抄襲盈利許可。
“但是,人類還沒有授權機器使用任何級彆的抄襲盈利標準。
“比如說,我畫了一幅畫,默認允許二哥你學習畫法。
“我允許你把我的畫的原子結構甚至分子存在自己的腦子裡隨時使用。
“但沒有允許你把他們存在機器裡麵供機器使用。
“機器要學習就要另外要授權。
“因為你說了,機器學習的邏輯,與人是相同的,但機器恰好又不是人類。
“機器學習相關又沒有任何現行法律。
“機器學習還沒有大規模出現,我並沒有直接給過它授權,更加沒有給過事實授權。
“甚至沒有給過你使用機器學習的授權。
“現在,我們要擬定相關法律,決定默認授權機器學習到什麼程度。
“我的建議是全部非默認,任何用於機器學習的資料,都必須得到創作者的直接授權。
“這樣做的目的不是為了阻止機器學習繼續進化。
“恰恰是要規範機器學習行業。
“未來是大數據的時代,機器學習的規模必然會越來越大。
“如果不限製機器學習的範圍和規則,必然導致這個產業的混亂發展。
“必然導致機器學習開發者互相抄襲且不可控。
“抄襲數據原子當然不是抄襲,那抄襲數據庫肯定就是抄襲了吧?
“就像照搬一個字庫的範圍不算抄襲,但照搬一本大詞典那就絕對是抄襲了。
“在大數據和機器學習的新時代,數據資料應該是有新的權屬規範。
“任何數據和資料,都應該是有權屬的,都是有價值的。
“我認為這應該是下個時代的時代邏輯。
“有了這樣的基礎規則,有了規範的收費和授權的基本規則。
“相應的數據模型開發者,才有機會將通過有授權的數據,開發出同樣有授權的數據模型。
“進而可以不受額外限製的使用機器生產的產品去盈利。
“否則,任何機器學習最終產生的作品,其著作權歸屬都是模糊和敏感的。
“機器不是人類,所以人類可以不保護機器的著作權,完全不認可機器創作的作品的著作權。
“隻有將機器視為人類的機器,創作的作品的著作權屬於其主人所有。
“才能以人類著作權的邏輯獲得保護並盈利。
“但人類想要利用彆人的素材盈利,就必須獲得對方的授權了,這樣也就形成了清晰的著作權歸屬。
“透過現象看本質的話,用機械智能完成以前隻有人能夠完成的工作,並且講產量和速度提升幾十幾百倍,是又一次的產業革命。
“生產力會再次跨越式的提升,技術能夠覆蓋的產品的生產成本會大幅度下降,由此產生的效益大幅度提升。
“為智能機器成功運行起來提供原料的人,有分享這種生產力提升所帶來的利益的權利。
“不能將個人欣賞學習的授權許可,用於研發和製造任何生產工具。
“這樣數據資料有價論的邏輯也就清晰了。”
朱靖垣聽完之後看向朱迪鈈:
“老二你怎麼看?”
朱迪鈈沉默思考了幾秒鐘,最終慢慢的點著頭說:
“我覺得迪鑭的話有道理……
“用微積分的邏輯來評判和區分學習、模仿、抄襲的界限是個很不錯的理念。
“未來的公共網絡平台上,創作者上傳自己的作品的時候。
“應該有一個是否允許機器學習的選項。
“同時也應該有一個是否使用大數據篩選和推薦信息的選項。”
朱迪鑭聽了馬上附和說:
“我讚成二哥的意見。”
朱靖垣笑著說:
“既然你們哥倆都覺得可行,那這些事情就這麼定了吧。
“不過問題是,你們怎麼判斷一個數據模型,是否用了未經授權的材料來訓練呢?
“在數據分析層麵你們有辦法區分嗎?”
朱迪鈈想了想說:
“可以在未經授權的素材中添加一些驗證數據,規避未經許可的機器學習的使用甚至汙染數據模型。
“不過……單純依靠技術手段是不行的,無法完全規避違規者的破解和甄彆以及反破壞技術。
“所以還是要用社會和製度層麵的限製以及事後處置方法……”
朱迪鈈說到這裡看向了弟弟。
朱迪鑭想了想說:
“製度上有兩個方向,一個是默認全部授權,同時默認全部收費。
“目前互聯網上的大規模藝術作品平台,都是朝廷和四大產業集團的官方平台。
“民間廠商和用戶想要自行建立數據模型,隻能從這些平台上采集數據。
“所以可以規定,沒有向現有平台之一付費取得授權資格的廠商,都直接按照違規處罰。
“另一個方向,是就由四大產業集團出麵,各自設計一套基礎軟件框架。
“相當於一個帶有強製過濾和篩選功能的裝置。
“民間廠商做任何的數據訓練,必須在這個基礎軟件框架之上開發。
“也就是放在這個過濾裝置之內。
“這個過濾程序自動甄彆未經授權的材料標記,直接不將未經授權的材料投入訓練過程。
“同時互聯網上應該在授權和未授權的材料上加入專門標記。
“供過這些濾裝置直接識彆。
“這些方案可以與二哥的技術方案同步實行。”
朱迪鈈聽了不由得點頭:
“好,識彆和反訓練技術是必須開發的。”
朱靖垣也沒有評價兩人的設想,就讓朱迪鈈和朱迪鑭哥倆商量著辦了。
 本章完