Datasets:
The full dataset viewer is not available (click to read why). Only showing a preview of the rows.
Error code: UnexpectedError
Need help to make the dataset viewer work? Open a discussion for direct support.
annotator_labels
sequence
| genre
string
| gold_label
string
| pairID
string
| promptID
string
| sentence1
string
| sentence1_binary_parse
string
| sentence1_parse
string
| sentence2
string
| sentence2_binary_parse
string
| sentence2_parse
string
| sentence1_tokenized
string
| sentence2_tokenized
string
|
---|---|---|---|---|---|---|---|---|---|---|---|---|
[] | "government" | "neutral" | "31193n" | "31193" | "Begrepsmessig kremskimming har to grunnleggende dimensjoner - produkt og geografi." | "" | "" | "Produkt og geografi er det som får kremskimming til å fungere." | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "101457e" | "101457" | "du vet i løpet av sesongen, og jeg antar at på nivået ditt øh, mister du dem til neste nivå hvis hvis de bestemmer seg for å huske foreldrelaget, bestemmer Braves seg for å ringe for å huske en fyr fra trippel A, så går en dobbel A-fyr opp til erstatt ham og en singel En fyr går opp for å erstatte ham" | "" | "" | "Du mister tingene til følgende nivå hvis folket husker det." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "134793e" | "134793" | "Et av våre nummer vil utføre instruksjonene dine minutiøst." | "" | "" | "Et medlem av teamet mitt vil utføre ordrene dine med enorm presisjon." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "37397e" | "37397" | "Hvordan vet du? Alt dette er deres informasjon igjen." | "" | "" | "Denne informasjonen tilhører dem." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "50563n" | "50563" | "ja, jeg forteller deg hva om jeg pris på noen av disse tennisskoene, skjønner jeg hvorfor nå vet du at de reiser seg opp i hundre dollar" | "" | "" | "Tennisskoene har en rekke priser." | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "110116e" | "110116" | "min walkman brøt, så jeg er opprørt nå, jeg må bare slå stereoanlegget opp veldig høyt" | "" | "" | "Jeg er lei meg fordi walkmanen min brøt, og nå må jeg skru stereoanlegget veldig høyt." | "" | "" | "" | "" |
[] | "travel" | "neutral" | "42487n" | "42487" | "Men noen få kristne mosaikker overlever over apsis, jomfruen med spedbarnet Jesus, med erkeengelen Gabriel til høyre (hans følgesvenn Michael, til venstre, har forsvunnet, med mindre det er noen fjær fra vingene)." | "" | "" | "De fleste kristne mosaikker ble ødelagt av muslimer." | "" | "" | "" | "" |
[] | "slate" | "entailment" | "1069e" | "1069" | "(Les for Slates oppfatning av Jacksons funn.)" | "" | "" | "Slate hadde en mening om Jacksons funn." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "23505c" | "23505" | "Homofile og lesbiske." | "" | "" | "Heterofile." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "60529c" | "60529" | "På slutten av Rue des Francs-Bourgeois er det mange anser for å være byens vakreste boligtorg, Place des Vosges, med fasader av stein og rød murstein." | "" | "" | "Place des Vosges er byens største forretningsdistrikt." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "55785e" | "55785" | "Jeg sprakk gjennom et sett med hyttedører, og falt til bakken -" | "" | "" | "Jeg sprakk gjennom dørene og falt ned." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "11877c" | "11877" | "Moro for voksne og barn." | "" | "" | "Moro for bare barn." | "" | "" | "" | "" |
[] | "slate" | "neutral" | "32819n" | "32819" | "Det er ikke det at spørsmålene de stilte ikke var interessante eller legitime (selv om de fleste faller inn under kategorien allerede stilt og besvart)." | "" | "" | "Alle spørsmålene var interessante ifølge en fokusgruppe som ble konsultert om emnet." | "" | "" | "" | "" |
[] | "travel" | "neutral" | "52772n" | "52772" | "Theben holdt på makten til det 12. dynastiet, da den første kongen, Amenemhet Iwho regjerte mellom 1980 1951 f.Kr. etablert en hovedstad nær Memphis." | "" | "" | "Hovedstaden nær Memphis varte bare et halvt århundre før innbyggerne forlot den til neste hovedstad." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "102489c" | "102489" | "Jeg mener ikke å være glatt over bekymringene dine, men hvis jeg var deg, ville jeg kanskje være mer bekymret for kortvarige renteimplikasjoner av denne $ 1." | "" | "" | "Jeg er mer bekymret for problemene dine enn de kortsiktige implikasjonene på kort sikt." | "" | "" | "" | "" |
[] | "government" | "entailment" | "81785e" | "81785" | "Problemer i datasyntese." | "" | "" | "Problemer i datasyntese." | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "16915e" | "16915" | "vel du ser det på TV også" | "" | "" | "Du kan se det på TV også." | "" | "" | "" | "" |
[] | "fiction" | "contradiction" | "56687c" | "56687" | "Vrenna og jeg kjempet begge mot ham, og han tok oss nesten." | "" | "" | "Verken Vrenna eller meg selv har noen gang kjempet mot ham." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "101211c" | "101211" | "Denne analysen samlet estimater fra disse to studiene for å utvikle en C-R-funksjon som knytter PM til kronisk bronkitt." | "" | "" | "Analysen viser at det ikke er noen sammenheng mellom PM og bronkitt." | "" | "" | "" | "" |
[] | "fiction" | "neutral" | "62897n" | "62897" | "Han snudde seg og smilte til Vrenna." | "" | "" | "Han smilte til Vrenna som gikk sakte bak seg med moren." | "" | "" | "" | "" |
[] | "government" | "entailment" | "38518e" | "38518" | "Vi søkte å identifisere praksis som ofte ble implementert av byråene de siste 5 årene." | "" | "" | "Vi ønsker å identifisere praksis som ofte er brukt av byråer de siste 5 årene" | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "138444e" | "138444" | "De andre mennene stokket." | "" | "" | "De andre mennene ble stokket rundt." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "76011c" | "76011" | "Stater må vise rimelige fremskritt i sine statsgjennomføringsplaner mot det kongressmessige målet om å gå tilbake til naturlige forhold i nasjonalparker og villmarksområder." | "" | "" | "Det er ikke nødvendig at det blir noen forbedring." | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "78652e" | "78652" | "vel det har vært veldig interessant" | "" | "" | "Det har vært veldig spennende." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "44022e" | "44022" | "Han begynte sakte tilbake til bunkhuset." | "" | "" | "Han kom sakte tilbake til køyehuset." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "129069n" | "129069" | "og det er ganske mye, jeg tror seks noe er staten, og resten av kaken går andre steder, men vi er i en bestemt del av staten som har det bra, så det er som om vi får mye av det tilbake som så langt som lokal beskatning går" | "" | "" | "Jeg vet ikke nøyaktig hvor lokale skatter går." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "144740c" | "144740" | "De er laget av en hemmelig oppskrift overlevert til dagens landsbyboere av deres mallorcanske forfedre, som kom hit tidlig på 1600-tallet som en del av en offisiell ordning for nybefolkning." | "" | "" | "Oppskriften fra Mallorcas forfedre er kjent for alle." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "87912n" | "87912" | "ja vel, du har en student rett" | "" | "" | "Vel, du er mekanikerstudent, ikke sant?" | "" | "" | "" | "" |
[] | "telephone" | "contradiction" | "128774c" | "128774" | "det er virkelig jeg har hørt noe om at de skulle starte en enorm kampanje i New York om barnemishandling og stoppe barnemishandling, og det skal være som om det begynner å skulle være som en stor landsomfattende kampanje, og du vet så forhåpentligvis at ta av og virkelig gjøre noe jeg ikke vet det bare er" | "" | "" | "Det er uheldig at ingen organiserer en barnemishandlingskampanje." | "" | "" | "" | "" |
[] | "government" | "entailment" | "22086e" | "22086" | "Posttjenesten skulle redusere leveringsfrekvensen." | "" | "" | "Posttjenesten kan levere sjeldnere." | "" | "" | "" | "" |
[] | "travel" | "entailment" | "110983e" | "110983" | "Og i et annet skifte i økonomien ble det funnet at lam kunne dyrkes mer kostnadseffektivt på lavlandsbruk delvis på grunn av det rikere og mer næringsrike beiteområdet som var tilgjengelig der, og som et resultat ble Lakeland-gårder mindre lønnsomme." | "" | "" | "Et annet skifte i økonomien ble funnet å være mer næringsrikt." | "" | "" | "" | "" |
[] | "government" | "entailment" | "73578e" | "73578" | "Regelen inneholder krav til informasjonsinnsamling som gjør det mulig for EPA å fastslå at vaskemiddeltilsetningsstoffer som er effektive for å kontrollere avleiringer blir brukt, og at utslippskontrollmål blir realisert." | "" | "" | "Regelen har krav til datainnsamling som hjelper EPA til å nå sine mål for utslippskontroll." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "78335c" | "78335" | "Nesten hver høyde har i nordøst et morisk fort; ikke færre enn fire ødelagte festninger vokter havneinngangen; og to til, fortsatt i god stand, beskytter Atalaya og Galeras-borgen strandarsenalet, av avgjørende betydning for Spanias militær." | "" | "" | "Det er ingen slott Atalaya og Galeras." | "" | "" | "" | "" |
[] | "slate" | "neutral" | "12090n" | "12090" | "Var de der inne?" | "" | "" | "Skulle de være der inne?" | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "103614c" | "103614" | "Felicias reise foregår bak øynene til den sentrale en ung irsk jenta, Felicia, som krysser havet til England i en håpefull søken etter å finne faren til det ufødte barnet sitt; og den tykke, middelaldrende cateringansvarlige, Hiditch, som er farlig interessert i lasset når det blir klart at den unge mannen hennes på kaddisk vis har gitt henne gliden." | "" | "" | "Kvinnen brydde seg ikke hvor mannen var så lenge den var langt." | "" | "" | "" | "" |
[] | "travel" | "entailment" | "37604e" | "37604" | "I krypten er restene av Voltaire og Rousseau, Hugo og Zola, myrdet sosialistisk leder Jean Jaurys og Louis Braille, oppfinneren av alfabetet for blinde, gravlagt." | "" | "" | "Her er mange bemerkelsesverdige mennesker begravet, inkludert forfattere Voltaire og Rousseau." | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "28378e" | "28378" | "det er et øh et par som heter um oh jeg kommer til å glemme navnet hans nå uh Dirkson" | "" | "" | "Jeg kan ikke huske navnet deres" | "" | "" | "" | "" |
[] | "fiction" | "contradiction" | "76592c" | "76592" | "Poirot, utbrøt jeg med lettelse, og grep ham med begge hender og dro ham inn i rommet." | "" | "" | "Poirot var nå tilbake, og jeg var lei meg for at han ville ta over det jeg nå anså for min egen etterforskning." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "75968c" | "75968" | "Ordet aswan betyr egentlig handel eller marked i det gamle egyptiske, noe som betyr den mest fremtredende aktiviteten." | "" | "" | "Aswan ble oppkalt etter en fugl." | "" | "" | "" | "" |
[] | "telephone" | "contradiction" | "102025c" | "102025" | "vel hva markedet tåler og" | "" | "" | "Markedet tåler ikke noe av det." | "" | "" | "" | "" |
[] | "travel" | "entailment" | "69555e" | "69555" | "Og for å vise hvor raskt Japans nye herskere fanget opp, ble to straffekspedisjoner lansert mot Korea og Kina på den store måten med pistolbåtdiplomati fra 1800-tallet." | "" | "" | "Japans nye herskere fanget raskt opp." | "" | "" | "" | "" |
[] | "government" | "neutral" | "12538n" | "12538" | "Når trustfondet begynner å løpe kontantunderskudd i 2016, må regjeringen som helhet komme opp med kontanter for å finansiere trygdens kontantunderskudd ved å redusere eventuelle anslåtte ikke-trygdeoverskudd, låne fra offentligheten, heve andre skatter eller redusere andre offentlige utgifter." | "" | "" | "Allmennheten foretrekker generelt å se regjeringen redusere sine utgifter på andre områder for å finansiere sosial sikkerhet." | "" | "" | "" | "" |
[] | "government" | "entailment" | "144037e" | "144037" | "Disse organisasjonene investerer tid og krefter på å forstå prosessene deres og hvordan disse prosessene bidrar til eller hemmer oppdragets oppnåelse." | "" | "" | "Disse organisasjonene bruker mye tid på å forstå hvordan noen prosesser kan bidra til eller haampe" | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "77527n" | "77527" | "og det er hyggelig å snakke med dere alle rett" | "" | "" | "Jeg snakker med deg hver dag." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "76546e" | "76546" | "Du har tilgang til fakta." | "" | "" | "Fakta er tilgjengelig for deg." | "" | "" | "" | "" |
[] | "government" | "entailment" | "16236e" | "16236" | "Bygg miljø Engineering Produksjon (all rate tooling) (første sett med produksjonsverktøy)" | "" | "" | "Det er det første settet med produksjonsverktøy for produksjon." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "133547c" | "133547" | "Så lenge du har din egen husstand i orden, er det veldig som å bekymre deg over naboens utgiftsvaner som å bekymre deg over fargen på stueeteppet hans." | "" | "" | "Du bør bekymre deg for fargen på naboens teppe." | "" | "" | "" | "" |
[] | "telephone" | "contradiction" | "119338c" | "119338" | "ja så uhm også selvfølgelig de de kan de blir med de de kan alltid bli med i militærtjenesten de regnes som borgere tror jeg" | "" | "" | "De kan ikke bli med i militærtjenesten" | "" | "" | "" | "" |
[] | "fiction" | "neutral" | "128144n" | "128144" | "Hun smilte tilbake." | "" | "" | "Hun var så glad at hun ikke kunne slutte å smile." | "" | "" | "" | "" |
[] | "government" | "entailment" | "32150e" | "32150" | "Ifølge Office of the Actuary at the Health Care Financing Administration er den estimerte netto nåverdien av fremtidige tilleggsressurser som trengs for å finansiere HI-fordeler alene i løpet av 75 år $ 4." | "" | "" | "Netto nåverdi av fremtidige tilleggsressurser for finansiering av HI-fordeler var $ 4." | "" | "" | "" | "" |
[] | "government" | "entailment" | "4064e" | "4064" | "Således, med hensyn til søksmålstjenestene Kongressen har finansiert, er det ingen alternativ kanal for uttrykk for advokatkongressen som søker å begrense." | "" | "" | "Dette er den eneste uttrykkelseskanalen for advokaten som Kongressen søker å begrense." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "95705e" | "95705" | "Hvordan fikser vi dette? '" | "" | "" | "Kan vi fikse dette?" | "" | "" | "" | "" |
[] | "telephone" | "contradiction" | "47305c" | "47305" | "men det tar for mye planlegging" | "" | "" | "Det skal ikke mye planlegging til." | "" | "" | "" | "" |
[] | "slate" | "neutral" | "72739n" | "72739" | "Jeg nevnte ikke Monica i foredraget mitt, men det første spørsmålet jeg ble spurt om var hvordan president Clinton kunne gjøre jobben sin med alle distraksjoner forårsaket av Monica Lewinsky-affæren." | "" | "" | "De ønsket å komme seg gjennom foredraget uten problemer." | "" | "" | "" | "" |
[] | "government" | "neutral" | "22132n" | "22132" | "Ved å analysere posttjenestekontoer for avskrivninger, drivstoff og vedlikehold for byleveringsselskaper, har vi estimert den gjennomsnittlige bykostnadskostnaden per rute." | "" | "" | "Kjørekostnadsestimater kan beregnes som gjennomsnitt for tilstrekkelige data." | "" | "" | "" | "" |
[] | "slate" | "neutral" | "89322n" | "89322" | "Fordi det spiller på fantasien min i barndommen." | "" | "" | "Kunsten spiller på min unge fantasi." | "" | "" | "" | "" |
[] | "telephone" | "contradiction" | "26806c" | "26806" | "det er tregt det er uh det er mange bedre maskiner på markedet akkurat nå for" | "" | "" | "Dette er den raskeste maskinen, du finner ikke en bedre maskin." | "" | "" | "" | "" |
[] | "travel" | "neutral" | "78697n" | "78697" | "I hjertet av helligdommen holdt en liten granitt-helligdom en gang den hellige barken til Horus selv." | "" | "" | "Barken til Horus ble stjålet fra et helligdom i helligdommen." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "57004c" | "57004" | "Tenk på den amerikanske posttjenesten." | "" | "" | "Glem United States Postal Service." | "" | "" | "" | "" |
[] | "fiction" | "neutral" | "100720n" | "100720" | "I full drakt." | "" | "" | "Han har på seg en maskotdrakt." | "" | "" | "" | "" |
[] | "government" | "neutral" | "46415n" | "46415" | "Selv om reisen din blir vanskelig, og til tider vil du tvile på deg selv, er fordelene for kundene vel verdt det, og tilfredsheten med å høre selv den mest motstridende motstanderen sier at det nye systemet er bedre enn det som gikk før, er dypt givende." | "" | "" | "Det nye systemet virker langt mer komplekst, men til slutt enklere og grundigere." | "" | "" | "" | "" |
[] | "slate" | "entailment" | "133002e" | "133002" | "Ta en bemerkelsesverdig statistikk som Shesol siterer, men lar passere relativt uundersøkt." | "" | "" | "De hadde data som var veldig relevante, men underbrukte." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "24875c" | "24875" | "Det kan ha virket som manna fra himmelen - opp til tusenvis av dollar som ofte, uventet, falt i hendene på en halv million innbyggere i Kentucky og Indiana denne måneden." | "" | "" | "En nylig lov foreslått av kongressen har resultert i beslagleggelse av tusenvis av dollar fra innbyggere i Kentucky." | "" | "" | "" | "" |
[] | "slate" | "entailment" | "113783e" | "113783" | "Få enkeltpersoner til å investere tiden, og finansieringen vil følge." | "" | "" | "Hvis enkeltpersoner vil investere tiden, vil finansiering også komme med." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "42162n" | "42162" | "Jeg tror ofte jeg skulle ønske jeg hadde et videokamera fordi jeg sikkert kunne bruke ti tusen dollar, men jeg liker ting som Evening Shade med Burt Reynolds, jeg liker det virkelig og øh" | "" | "" | "Videokameraer som jeg trenger er veldig dyre." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "14692c" | "14692" | "Mannen på bakken tenker et øyeblikk og roper tilbake: Du må jobbe i ledelsen." | "" | "" | "Det var ingen på bakken, mann eller kvinne." | "" | "" | "" | "" |
[] | "government" | "contradiction" | "103123c" | "103123" | "Hvis evalueringsspørsmålet imidlertid krever at GAO rapporterer om hvor tilfredsstillende fremgang er eller årsakene til implementeringsproblemer, desto flere ansatte som kan være på stedet over tid, med den rikeste eller tykkeste basen for å undersøke situasjonen som de mange de involverte ser det, desto sunnere blir årsaksslutningene våre og påfølgende anbefalinger." | "" | "" | "Hvis GAO må rapportere om fremdriften, vil anbefalingene være mye dårligere kvalitet." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "18626c" | "18626" | "Økonomien kan være fortsatt bedre." | "" | "" | "Økonomien har aldri vært bedre." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "141306c" | "141306" | "Åser og fjell er spesielt helliggjort i kulten av jainisme." | "" | "" | "Kulten av jainisme hater naturen." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "98642c" | "98642" | "De berømte leietakene (eller landene) begynte å bli bygget." | "" | "" | "Landet forble øde." | "" | "" | "" | "" |
[] | "travel" | "neutral" | "132546n" | "132546" | "Midt i denne fantastiske kulturen er det en lidenskap for kontinuitet." | "" | "" | "En lidenskap for kontinuitet er ikke den viktigste av disse kulturene." | "" | "" | "" | "" |
[] | "slate" | "neutral" | "66654n" | "66654" | "Ved å sette av scenen som en hestetransport, en populær delikatessebutikk, en del av en rakett og en mulighet til å spotte Gail Sheehy (som ser ut til å få en gratis tur fra deltakerne i News Quiz), krevde dette spørsmålet alt annet enn oppfinnelsen av en voldelig teaterbegivenhet, og det er ikke lett." | "" | "" | " Gail Sheehy er et populært mål for å spotte på andre show." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "75438c" | "75438" | "Forpliktelser til leilighetens eier har gått ingen steder." | "" | "" | "Leilighetens eier er veldig lydhør." | "" | "" | "" | "" |
[] | "fiction" | "contradiction" | "1031c" | "1031" | "Fru Cavendish er på svigermorens rom." | "" | "" | "Fru Cavendish har forlatt bygningen." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "130556c" | "130556" | "Men jeg trodde du hadde sverget av kaffe." | "" | "" | "Jeg trodde at du lovte å drikke mer kaffe." | "" | "" | "" | "" |
[] | "slate" | "entailment" | "18783e" | "18783" | "Vi stinker hele tiden." | "" | "" | "Vi stinker alltid." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "68197c" | "68197" | "I en stadig mer gjensidig avhengig verden kan mange presserende problemer som berører amerikanere løses bare gjennom samarbeid med andre land." | "" | "" | "Vi bør være uavhengige og holde oss borte fra å snakke og samarbeide med andre nasjoner." | "" | "" | "" | "" |
[] | "fiction" | "neutral" | "140273n" | "140273" | "Ca'daan fortsatte." | "" | "" | "Ca'daan nektet å stoppe." | "" | "" | "" | "" |
[] | "government" | "entailment" | "63983e" | "63983" | "Regelen krever at kringkastere skal føre en fil for offentlig ettersyn som inneholder en programmeringsrapport for barns fjernsyn og identifisere programmer som er spesielt utviklet for å utdanne og informere barn i begynnelsen av disse programmene, og å gi slik informasjon til utgivere av programguider." | "" | "" | "Regelen gjør at kringkastere holder en fil om barns TV-programmering." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "11203n" | "11203" | "vel fordi hvor varmt jeg mener som i det kaldeste at det blir om vinteren der nede hvor mye er det" | "" | "" | "Det er varmt hele tiden der jeg bor, inkludert vinteren." | "" | "" | "" | "" |
[] | "fiction" | "contradiction" | "29756c" | "29756" | "Hver av mennene hadde på seg rustning i skinn og kledde seg i stil med tunge ryttere." | "" | "" | "Mennene var nakne." | "" | "" | "" | "" |
[] | "fiction" | "contradiction" | "2637c" | "2637" | "Mannen burde ha dødd øyeblikkelig." | "" | "" | "Mannen hadde det helt greit." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "9386c" | "9386" | "Om sommeren danner risen et grønt fløyelsaktig teppe, og blir deretter gyldent om høsten når det modnes og høstes." | "" | "" | "Risen er gylden og høstbar om sommeren, men blir grønn om høsten." | "" | "" | "" | "" |
[] | "slate" | "entailment" | "133772e" | "133772" | "Akkurat som Daily Worker and New Masses, sosialistiske papirer fra 1930-tallet, ble krydret med sitater fra Marx og Engels, er Educational Liberator peppered med referanser til deres libertariske ekvivalenter - Friedrich Hayek og Ludwig von Mises." | "" | "" | "Sitater fra Marx ble brukt i sosialistiske papirer på 30-tallet." | "" | "" | "" | "" |
[] | "travel" | "neutral" | "11647n" | "11647" | "For å være sikker på at ethvert håndarbeidsgjenstand er den ekte artikkelen (i motsetning til en underordnet import eller maskinfabrikk), må du se etter en blyforsegling med M, emblemet til IBTAM, som betyr at den er sertifisert av Instituto de Bordado, Tapecaras e Arte? Sanato da Madeira (Institute of Madeiran Brodery, Tapestry and Handicrafts), en offisiell øyorganisasjon som har et showroom / museum på Rua Visconde de Anadia, 44." | "" | "" | "Det er et segl for å vise ektheten i håndarbeidsprodukter laget i Italia." | "" | "" | "" | "" |
[] | "fiction" | "entailment" | "101509e" | "101509" | "Jeg er ikke interessert i denne Multivista-saken, for hva er noe dumpy system sammenlignet med en vakker hyperextensjon av solen et sted over Kuchara, sammenlignet med den gyldne fargen på løk stekt med kse-fi-bølgene, sammenlignet med antall skillelinjer for kredittmembraner i en lommebok til en rik mann, sammenlignet med den fantastiske lukten av en briessante rulle dyppet i sunn melk som er syntetisk beriket med stoffer som øker utskillelsen av lykkehormoner, en fra to år siden, ikke tre, 'sa Gonzo. i en tone som er karakteristisk for en mann som nettopp oppdaget en løsning på sitt livsproblem." | "" | "" | "Han er ikke interessert i disse multivista-tingene, for hva er noe dumpy system sammenlignet med den fantastiske lukten av en kanelrulle dyppet i sunn melk." | "" | "" | "" | "" |
[] | "government" | "neutral" | "137081n" | "137081" | "Uansett hva jeg endte med å gjøre, tror jeg at jeg ville ha funnet en måte innen det yrket å gjøre offentlig arbeid, for det er det jeg ble lært, sa Zelon." | "" | "" | "Dette er som å bruke posten som bankmann for å gjøre regelverket bedre for publikum." | "" | "" | "" | "" |
[] | "slate" | "entailment" | "44155e" | "44155" | "Clark uttrykte også håp om at han og Redgrave kunne fortsette med ekteskapet." | "" | "" | "Clark håpet at han kunne fortsette ekteskapet deres." | "" | "" | "" | "" |
[] | "travel" | "contradiction" | "51429c" | "51429" | "Fattigdommen skaper for eksempel ikke skamfølelse som for mennesker som bor i vestlige land." | "" | "" | "Fattigdom skaper ikke en følelse av skam i noe land." | "" | "" | "" | "" |
[] | "travel" | "neutral" | "109006n" | "109006" | "Tilbake på veien til Jaisalmer gleder et siste fargeklatt sansene før du stuper ut i markene er prikket med hauger av rødglødende chilipepper." | "" | "" | "Veien til Jaisalmer er humpete og ubehagelig å ri på." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "49524n" | "49524" | "de leverte noen uh du vet at de var noen grupper uh Vicksburg hvis du noen gang får sjansen til å gå over til Vicksburg slagmarken ved Vicksburg uh det er et område der det var uh noen Texas uh grupper og de hadde en interessant tid der" | "" | "" | "Det var også North Carolina-tropper i Vicksburg." | "" | "" | "" | "" |
[] | "telephone" | "contradiction" | "34844c" | "34844" | "som jeg mener jeg synes det burde være uansett" | "" | "" | "Jeg tror ikke det skal være slik" | "" | "" | "" | "" |
[] | "government" | "contradiction" | "77986c" | "77986" | "Kompensasjonskomiteer må også forstå implikasjonene av kompensasjon for å gi ledelsen insentiver til å gjøre det rette for selskapet og dets aksjonærer i forhold til seg selv." | "" | "" | "Implikasjonene av kompensasjon for å gi incentiver for ledelsen til å gjøre det rette for selskapet og dets aksjonærer i forhold til seg selv, bør alltid ignoreres av kompensasjonskomiteene." | "" | "" | "" | "" |
[] | "travel" | "entailment" | "32331e" | "32331" | "Den romerske keiseren Gratianus fra det fjerde århundre var en tidlig besøkende, etterfulgt mye senere av slike lys som den romantiske dikteren Alphonse de Lamartine, dronning Victoria, Saint-Sa? «Ns og Rachmaninov." | "" | "" | "Den romerske keiseren Gratianus var fra det fjerde århundre." | "" | "" | "" | "" |
[] | "government" | "entailment" | "119274e" | "119274" | "Så jeg gikk rettens vei for meg selv og fortalte dem sannheten, men det gjorde ikke noe for meg." | "" | "" | "Jeg gikk og fortalte sannheten i retten, men det gjorde ikke noe for meg." | "" | "" | "" | "" |
[] | "slate" | "contradiction" | "144385c" | "144385" | "Klikk på Flere koblinger (på høyre side under Diverse), og fra" | "" | "" | "Det er ingen lenker å klikke under Diverse." | "" | "" | "" | "" |
[] | "telephone" | "neutral" | "14868n" | "14868" | "og så begynte jeg å se på det, og med ett følg med på neste uke, og jeg gikk hva" | "" | "" | "Jeg hadde ikke begynt å se på det hvis jeg hadde visst det." | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "133436e" | "133436" | "nei å nei å vel ta vare" | "" | "" | "Ha det så lenge." | "" | "" | "" | "" |
[] | "fiction" | "contradiction" | "26025c" | "26025" | "'Hei, Ben.'" | "" | "" | "Jeg ignorerte Ben" | "" | "" | "" | "" |
[] | "telephone" | "entailment" | "24696e" | "24696" | "hvordan kan du bevise det" | "" | "" | "Kan du fortelle meg hvordan jeg skal bevise det?" | "" | "" | "" | "" |
MNLI Norwegian
The Multi-Genre Natural Language Inference (MultiNLI) corpus is a crowd-sourced collection of 433k sentence pairs annotated with textual entailment information. The corpus is modeled on the SNLI corpus, but differs in that it covers a range of genres of spoken and written text, and supports a distinctive cross-genre generalisation evaluation. There is also a HuggingFace version of the dataset available.
This dataset is machine translated using Google Translate. From this translation different version of the dataset where created. Included in the repo is a version that is specifically suited for training sentence-BERT-models. This version include the triplet: base-entailment-contradiction. It also includes a version that mixes English and Norwegian, as well as both csv and json-verions. The script for generating the datasets are included in this repo.
Please note that there is no test dataset for MNLI, since this is closed. The authors of MNLI informs us that they selected 7500 new contexts in the same way as the original MNLI contexts. That means the English part of the XNLI test sets is highly comparable. For each genre, the text is generally in-domain with the original MNLI test set (it's from the same source and selected by me in the same way). In most cases the XNLI test set can therefore be used.
The following datasets are available in the repo:
- mnli_no_en_for_simcse.csv
- mnli_no_en_small_for_simcse.csv
- mnli_no_for_simcse.csv
- multinli_1.0_dev_matched_no_mt.jsonl
- multinli_1.0_dev_mismatched_no_mt.jsonl
- multinli_1.0_train_no_mt.jsonl
- nli_for_simcse.csv
- xnli_dev_no_mt.jsonl
- xnli_test_no_mt.jsonl
Licensing Information
The majority of the corpus is released under the OANC’s license, which allows all content to be freely used, modified, and shared under permissive terms. The data in the FICTION section falls under several permissive licenses; Seven Swords is available under a Creative Commons Share-Alike 3.0 Unported License, and with the explicit permission of the author, Living History and Password Incorrect are available under Creative Commons Attribution 3.0 Unported Licenses; the remaining works of fiction are in the public domain in the United States (but may be licensed differently elsewhere). The translation and compilation of the Norwegian part is released under the Creative Commons Attribution 3.0 Unported Licenses.
Citation Information
The datasets are compiled and machine translated by the AiLab at the Norwegian National Library. However, the vast majority of the work related to this dataset is compiling the English version. We therefore suggest that you also cite the original work:
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}
- Downloads last month
- 93