Maktaba >

Data ya mafunzo ya AI na hakimiliki: Kufafanua ripoti ya Ofisi ya Hakimiliki ya Marekani itakayochapishwa hivi karibuni

Leigh Ebrom

Imechapishwa:

Picha nyeusi na nyeupe ya modeli ya moduli nyingi

Kwa nini ripoti ya kabla ya kuchapishwa inastahili kuzingatiwa

Najua. "Kabla ya kuchapishwa" inasikika kama ya kusisimua kama kusubiri kahawa yako itoe. Lakini rasimu ya ripoti ya kurasa 108 ya Ofisi ya Hakimiliki ya Marekani, Hakimiliki na Akili Bandia; Sehemu ya 3: Mafunzo ya Akili Bandia yanazipa kampuni zinazofunza mifumo ya AI na kuunda maudhui mtazamo nyuma ya pazia la udhibiti. Ukijenga kampeni za uuzaji , kufunza mifumo ya kujifunza kwa mashine , au kupoteza usingizi kuhusu kama muhtasari wa AI ya kesho utaiga machapisho yako ya blogu, ripoti inapaswa kuwa kwenye dawati lako.

Ofisi ya Hakimiliki bado haijakamilisha msimamo wake, lakini hati hiyo inachora mistari ya sera ambayo sote tutalazimika kuipaka rangi ndani. Inauliza maswali matatu ambayo si rahisi sana:

  1. Je, kunakili kazi zinazolindwa ili kufunza mifumo ya kuzalisha akili bandia (AI) ni ukiukaji wa msingi wa dhana ?
  2. Ikiwa ndio, ni lini (ikiwa imewahi kutokea) matumizi ya haki yanaokoa siku?
  3. Serikali inapaswa kusawazisha vipi maslahi ya makampuni ya AI na waundaji wa maudhui?

Nyuma ya maswali hayo kuna maabara za akili bandia za mabilioni ya dola, karne nyingi za kazi ya ubunifu, na muhtasari wako unaofuata wa uuzaji. Hebu tuchunguze Ofisi ya Hakimiliki inaelekea wapi, kihalali.

USCO inajaribu kusawazisha maslahi shindani ya watengenezaji wa akili bandia na waundaji wa maudhui

Wahusika wanaovutiwa, ikiwa ni pamoja na mashirika ya biashara, watu binafsi, na biashara kubwa kama Meta, waliwasilisha maoni zaidi ya 10,000 kwa USCO. Ofisi inatambua ukubwa wa mjadala kuhusu data ya mafunzo ya AI na kesi nyingi zinazoendelea kusikilizwa katika mahakama za Marekani. Watu wana hisia kubwa kuhusu data ya mafunzo ya AI na miliki miliki.

USCO inatambua kwamba hii inaingia katika hali ngumu. Inatoa maoni:


Baadhi wanaonya kwamba kuzitaka kampuni za AI kutoa leseni za kazi zenye hakimiliki kutapunguza teknolojia inayobadilisha, kwa sababu haiwezekani kupata leseni za wingi na utofauti wa maudhui muhimu ili kuendesha mifumo ya kisasa. Wengine wanaogopa kwamba mafunzo yasiyo na leseni yataharibu mfumo ikolojia wa ubunifu, huku kazi zote za wasanii zikitumika kinyume cha mapenzi yao kutoa maudhui yanayoshindana nao sokoni. Maslahi ya umma yanahitaji usawa mzuri, kuruhusu uvumbuzi wa kiteknolojia kustawi huku ikidumisha jamii yenye ubunifu inayostawi.

Zaidi ya hayo, akili bandia na mifumo yake ya mafunzo inabadilika kwa kasi. Na mafundisho ya matumizi ya haki yana tofauti. Karibu unapata hisia kwamba Ofisi inatuomba uvumilivu na kutuhakikishia kwamba wanaona pande zote mbili za mjadala katika Sehemu ya 3 ya mwongozo wao wa AI.

Hata hivyo, pamoja na kueleza mambo muhimu ya jinsi mifumo ya mafunzo ya AI inavyofanya kazi, inaelezea mwelekeo wake wa jumla wa kusonga mbele.

Kunakili maudhui ni ukiukaji wa msingi

Hatua ya ufunguzi ya Ofisi ni ya wazi: msanidi programu anapotafuta riwaya, picha, au wimbo wenye hakimiliki ili kufunza mfumo wake, kitendo hicho huangalia visanduku vya dai la ukiukaji. Prima facie , Kilatini kwa "kwa mtazamo wa kwanza," inamaanisha mdai ameondoa kikomo cha kuonyesha ukweli mbili: anamiliki kazi hiyo na wewe umeinakili. Hilo pekee linakupeleka mahakamani, hata kama ulinzi mkali (kama vile matumizi ya haki) bado unaweza kuendelea.

Lakini shtaka si mwisho wa hadithi. Fikiria kama tikiti ya mwendo kasi: afisa anakuelekeza umbali wa maili 15 zaidi ya kikomo na anakupa nukuu. Hiyo ndiyo kesi ya kwanza , uthibitisho kwamba ulikuwa barabarani na umevuka kizingiti. Bado una nafasi ya kuonyesha kwa nini tikiti haipaswi kukwama: labda bunduki ya rada ilikuwa na hitilafu au ulikuwa unajaribu kuepuka ajali. Ikiwa kesi ya kwanza ndiyo tiketi; matumizi ya haki yanaweza kuwa siku yako mahakamani.

INAYOHUSIANA: Hakimiliki na AI: Suala la uandishi wa binadamu 

Matumizi ya haki yatapimwa kwa msingi wa kesi kwa kesi

Katika sheria ya hakimiliki ya Marekani, matumizi ya haki ni vali ya usalama inayowaruhusu waundaji wa maudhui kukopa vipande vya kazi ya mtu mwingine wakati kufanya hivyo kuna manufaa kwa umma kwa ujumla. Sio ruhusa ya jumla; ni uchanganuzi unaoendeshwa na muktadha unaozingatia vipengele kadhaa kabla ya kuamua kama ruhusa ilihitajika kweli.

Mahakama zinasawazisha mambo manne:

  1. Kusudi na tabia ya matumizi : Je, awamu ya mafunzo ya modeli hiyo ni ya mabadiliko au ya kibiashara tu?
  2. Aina ya kazi: Je, tunazungumzia lahajedwali za ukweli au riwaya iliyoshinda Pulitzer?
  3. Kiasi na ukubwa : Ni kiasi gani cha asili kiliishia ndani ya vigezo vya modeli—na kinaweza kutolewa tena?
  4. Athari za Soko : Je, matokeo ya AI yanashindana au yanadhoofisha mapato ya muundaji wa awali?

Ripoti ya USCO haitangazi washindi. Badala yake, inatoa machapisho ya mwongozo: matumizi yanayolenga utafiti, yenye mabadiliko yanayolenga matumizi ya haki. Matokeo yanayoiga au kuchukua nafasi ya mwelekeo wa awali dhidi ya. Kila modeli, seti ya data, na mpango wa biashara utapata siku yake mahakamani, iwe ya kimfano au halisi.

"Inapatikana hadharani" hailingani na "bure kutumia"

Kukwaruza mtandao wazi huhisi kama kidemokrasia hadi utakapogundua ni kazi ngapi zenye hakimiliki zinazojificha waziwazi. Seti ya data ya Books3 inajumuisha riwaya kamili kutoka kwa waandishi walio hai. Common Crawl ilisafisha tovuti zote za habari.

Maelezo ya ripoti hiyo yako wazi: eneo halibatilishi umiliki. Ikiwa bomba lako linategemea URL za umma, likague kama vile ungefanya mkataba mpya wa muuzaji. Ujinga si utetezi; lazima ufanye uchunguzi wa kina unapojenga seti zako za data za mafunzo.

Leseni tayari inaandika upya sheria za ushiriki

Hapa kuna mtazamo wa matumaini ambao USCO inaangazia: viwanda vya ubunifu na watengenezaji wa AI wanaanza kuzungumzia biashara badala ya kushawishi kesi. Universal Music ilikata mikataba na watengenezaji wakubwa wa nyimbo za AI. Getty Images ilitia saini makubaliano ambayo yaliwaruhusu wajenzi wa mifumo kutumia maktaba yake kubwa ya picha bila kukanyaga mabomu ya ardhini.

Mikataba hii ya awali ni muhimu kwa sababu inathibitisha kwamba soko linaweza kuunda. Ofisi ya Hakimiliki inasema, katika nathari ya serikali kwa heshima, "Hebu tuone ni kwa kiwango gani leseni za hiari zinaweza kutupeleka kabla ya kuweka suluhisho la jumla." Kwa maneno mengine, ikiwa tasnia inaweza kujipanga yenyewe, Bunge litaweka mikono yake mifukoni kwa muda mrefu zaidi.

Kuna zana kamili ya sera mezani. Leseni ya lazima ndiyo chaguo la mwisho

Ikiwa mikataba ya hiari itakwama, ripoti hiyo itaweka leseni ya pamoja iliyopanuliwa (ECL) kama msukumo laini wa kisheria. Chini ya ECL, waundaji wanaweza kuchagua kundi linalojadiliana kwa niaba yao, huku watumiaji wakipata viwango vinavyotabirika. Tayari ni jambo la kawaida huko Skandinavia kwa haki za kunakili na kutiririsha.

Leseni ya lazima, chombo chenye nguvu kinacholazimisha ufikiaji kwa ada iliyowekwa, inabaki kuwa chaguo la mwisho. Ofisi ya Hakimiliki inaonya kwamba mipango ya lazima ina mantiki tu wakati masoko yanashindwa kabisa. Hadi sasa, wasimamizi wanabaki na matumaini kwamba biashara zinaweza kufafanua maelezo yao wenyewe.

Ubunifu wa kawaida kwa enzi ya AI?

Ripoti hiyo inaashiria mustakabali ambapo waundaji, majukwaa, na makampuni ya teknolojia yanashirikiana kubuni kitambaa cha leseni chenye nguvu ya kutosha kusaidia mafunzo makubwa huku ikihakikisha wasanii wanalipwa. Iite Creative Commons 2.0, mfumo ikolojia ambapo ruhusa husafiri na faili, malipo madogo ya mrabaha hutiririka kiotomatiki, na ugawaji huwekwa kwenye metadata.

Hatujafika bado, lakini mbegu zinaonekana: vitambulisho vya asili vya Mpango wa Uthibitishaji wa Maudhui, mapendekezo ya alama za maji kutoka kwa OpenAI na Anthropic, na sajili za haki zinazotegemea blockchain. Ofisi ya Hakimiliki inasema kwa ufanisi, "Endelea kuchambua; tunaangalia."

Jinsi sheria za mafunzo ya akili bandia zinavyowaathiri wauzaji, mashirika, na wabunifu wa ndani

Ripoti ya Ofisi ya Hakimiliki inaonyesha tofauti iliyo wazi kati ya kile kinachoingia katika mfumo (data ya mafunzo) na kile kinachotoka humo (maudhui yanayozalishwa). Hatua zote mbili zina majukumu ya kipekee kwa timu za uuzaji zinazotegemea au kujenga zana zao za akili bandia.

Hatari za hatua ya mafunzo

Seti za data zisizo na leseni au zilizoandikwa vibaya huunda mfiduo mkubwa zaidi hapa. Mitego ya kawaida ni pamoja na:

  • Maudhui yaliyofutwa mtandaoni bila ruhusa. URL za umma bado zina hakimiliki, na "matumizi ya haki" si ya kiotomatiki.
  • Data ya mtu wa tatu isiyo na uhakika. Data iliyotolewa na muuzaji inaweza kuchanganya kazi zenye leseni na zisizo na leseni; utarithi dhima ikiwa utazirekebisha.
  • Nyenzo za mshindani au mteja. Maandishi ya umiliki yaliyoingizwa kimakosa yanaweza kukiuka NDA na sheria za faragha pamoja na hakimiliki.

Vidhibiti vya vitendo vya data ya mafunzo

  • Ukaguzi wa chanzo kabla ya kumeza. Thibitisha hali ya hakimiliki, masharti ya leseni, na vikwazo vyovyote vya matumizi.
  • Leseni zilizoandikwa au masharti ya huduma yaliyo wazi. Kwa maktaba za hisa, majarida ya biashara, na waundaji maalum, jadili posho za mafunzo zilizo wazi.
  • Nyaraka za chembechembe. Dumisha hashes, mihuri ya muda, na mnyororo wa kumbukumbu za uhifadhi kwa kila toleo la seti ya data.
  • Upunguzaji wa data. Hifadhi dondoo zinazohitajika kwa lengo la modeli pekee; futa faili zisizo muhimu.
  • Tathmini upya ya mara kwa mara. Changanua upya seti za data za zamani wakati leseni zinapoisha muda wake au sheria zinapobadilika.

INAYOHUSIANA: Kazi isiyoonekana nyuma ya maudhui yenye ufanisi

Ulinzi wa hatua ya matokeo

Hata data ya mafunzo iliyopangwa vizuri bado inaweza kutoa nyenzo zinazokiuka sheria ikiwa reli za ulinzi hazijalegea. Punguza hatari kwa:

  • Kuchanganua ulinganifu. Endesha maandishi na picha zilizozalishwa kupitia vigunduzi vya kiotomatiki vinavyoingiliana kabla ya kuchapishwa.
  • Vituo vya ukaguzi wa kibinadamu. Chukulia rasimu za modeli kama malighafi inayohitaji kuidhinishwa kwa uhariri.
  • Vichujio vya maudhui na vikwazo vya haraka. Maombi ya kuzuia yanaweza kusababisha dondoo halisi kutoka kwa kazi zenye hakimiliki.
  • Kurekodi mara kwa mara. Hifadhi vidokezo, matokeo, na madokezo ya mhakiki ili uweze kuunda upya matukio ikiwa dai litatokea.

Kwa nini ni muhimu

  • Wauzaji hulinda usawa wa chapa na huepuka kufutwa kwa bidhaa wakati pembejeo na matokeo yao ya mafunzo yanafuatiliwa na yana leseni.
  • Mashirika hubadilisha uzingatiaji mkali kuwa nyongeza ya thamani kwa wateja wanaotarajia kasi na usalama.
  • Wabunifu na wataalamu wa teknolojia ndani ya kampuni hupunguza mapigano ya moto kisheria, na hivyo kutoa muda wa mikakati na majaribio.

Tumia vidhibiti hivi mapema na utatumia nguvu zaidi katika uboreshaji wa ubunifu—na kidogo zaidi katika majibu ya kusitisha na kukataa.

Hadithi ya tahadhari ya "AcmeGPT"

Fikiria hili: Acme Inc. inakusanya machapisho milioni moja ya blogu, yenye mapishi, shajara za usafiri, ushauri wa kisheria, ili kujenga AcmeGPT, msaidizi wa uandishi anayewalenga watumiaji. Wapimaji wa beta wa mapema wanapenda. Kisha waandishi wanaona aya zilizotolewa kwa jumla kutoka kwa kazi zao zilizo na hakimiliki.

Timu ya wanasheria ya Acme inajitahidi. Seti yao ya data ilijumuisha kila kitu chini ya jua kwa sababu "umma ni wa umma," sivyo? Sivyo. Wanakumbwa na notisi za kuondoa na kesi ya hatua za kitabaka. Imani ya wawekezaji inayumba. Thamani ya takwimu tisa inatoweka.

Sasa rudisha nyuma. Fikiria Acme ilikuwa imeipa leseni maudhui kutoka kwa wachapishaji watatu maalum, ikaweka kumbukumbu ya asili yake ya data, na kuchuja matokeo ili kuepuka dondoo za moja kwa moja. Uzinduzi huo ungekuwa na gharama zaidi mapema, lakini njia halali ingekuwa wazi, na usawa wa chapa ya kampuni hiyo ungekuwa sawa.

Hilo, kwa ufupi, ndilo uamuzi unaomkabili kila muuzaji wa kisasa.

KUHUSIANA: Jinsi ya kumtambua muuzaji wa mafuta ya nyoka wa teknolojia ya kisheria

Wauzaji wanapaswa kufanya nini kesho asubuhi

Orodha ya mambo ya kufanya kesho haihitaji PhD, bali hatua za vitendo tu:

  • Ramani ya vyanzo vyako vya data. Ni nani anayevimiliki? Je, una leseni? Unaweza kuvibadilisha kwa urahisi kiasi gani?
  • Tathmini matokeo yako. Je, maandishi, picha, au sauti zinaweza kufuatiliwa hadi kwa muundaji mmoja? Ikiwa ndio, uko karibu sana kwa faraja.
  • Jadili leseni zinazofaa. Wasiliana na watoa huduma za maudhui ya hisa, majarida ya biashara, au hata watu wenye ushawishi binafsi. Ni nafuu kuliko kesi za madai.
  • Weka mizunguko ya mapitio katika mtiririko wako wa kazi. Wahariri wa kibinadamu wanapaswa kubaki maili ya mwisho kabla ya kuchapishwa, haswa katika tasnia zinazodhibitiwa kama vile sheria, huduma ya afya, na fedha.
  • Endelea kuwa mwepesi. Turubai ya sera itabadilika. Jenga michakato ambayo inaweza kunyumbulika bila kubomoa nyumba nzima.

Mbinu ya LaFleur ya kufuata sheria - kwanza, ubunifu - kila wakati

Katika LaFleur, tunaishi katika makutano ya ubunifu wa ujasiri na utiifu makini. Wateja wetu, makampuni ya sheria, wavumbuzi wa huduma za afya, viongozi wa huduma za kifedha, hawana anasa ya "kusonga mbele haraka na kuvunja mambo." Wanahitaji kusonga mbele kwa busara na kujenga uaminifu.

Kwetu sisi, kufuata sheria si nyongeza. Imejengwa katika kila ushiriki wa AI. Tunachunguza vyanzo vya data, tunaendesha tathmini za hatari, tunaweka rekodi za kina kuhusu seti zetu za data, na tunapitia matokeo kabla hayajaanza kutumika ili wateja wetu waweze kujaribu kwa kujiamini, bila kuwa na wasiwasi.

Uko tayari kutumia akili bandia kwa usalama? Tuzungumze.

Ikiwa ungependa ramani iliyo wazi na inayofaa kwa AI inayotii sheria, iwe unachagua data ya mafunzo, unaweka hatua za ukaguzi, au unamtathmini muuzaji, panga mashauriano ya awali na timu yetu.

Rasilimali

Hakimiliki na Akili Bandia; Sehemu ya 3: Mafunzo ya Akili Bandia (Toleo la Kabla ya Kuchapishwa). (Mei 2025). Ofisi ya Hakimiliki ya Marekani. Imechukuliwa kutoka https://chatgpt.com/c/6821e5d5-0e08-8001-90cf-7ce101958778?model=o3