Birleştirici sayma


29

Buradaki zorluk N kod parçacığını yazmaktır , öyle ki, ilk K ≥ 1'i bir araya getirdiğinizde, K sayısını üretirler . Daha yüksek , N , iyi. İşte yakalama: Parçacıklar boyunca birden fazla karakter kullanamazsınız.

kurallar

  • Aynı karakteri bir (ve yalnızca bir) pasajda birden çok kez kullanabilirsiniz.
  • Bu snippet'ler, atlanmadan , sunuldukları sırayla birleştirilmelidir .
  • En az iki snippet yazmalısınız.
  • Tüm snippet'ler aynı dilde olmalıdır.
  • Unutmayın: parçacıkları yok tam programlar veya fonksiyonlar olmak zorunda, ne de kendi başlarına işlevine var. -1Java’da geçerli bir snippet
  • Sonuçta ortaya çıkan tüm birleştirmeler ilgili K değerini vermelidir .
  • Kazanan, N değeri en yüksek olan kişidir . Tie-breaker, bayt cinsinden programın toplam uzunluğu en kısadır.

Örnek

Snippet'lerinizin varsay AD, xc, 123, ve ;l. Sonra:

  • AD üretmeli 1
  • ADxc üretmeli 2
  • ADxc123 üretmeli 3
  • ve ADxc123;lüretmeli 4.

Bu program 4 puan alacaktır .


4
Metin parçacıkları olmaları gerektiğinden, yığın tabanlı bir dilde sayılar yalnızca yığının üstüne basılabilir, değil mi?
Tamamen insan

Tamamen insanın sorusuna eklemek için, yığın temelli bir dilde önemli olan tek değer üst düzey mi? Bu, dc'deki ilk iki snippet olabilir 1ve `2` olabilir mi?
brhfl

@totallyhuman hayır diyebilirim - yığın tabanlı bir ortamda, yığın üzerinde birden fazla değeriniz varsa, istenen bir tamsayı yerine birden fazla değer "ürettiniz".
Conor O'Brien,

@brhfl Yukarıya bakınız.
Conor O'Brien,

@ ConorO'Brien Yığının sadece üstü çıktı olarak kabul edilebilir mi? 'Aksi takdirde, yığın tabanlı bir dilde IO
içermeyen

Yanıtlar:


10

Python 3 , 1 112 056 parçacıkları, 4 383 854 bayt

Bu @ WheatWizard'ın Python 2 cevabına çok benziyor . Yayınlanmadan kısa bir süre önce bunun üzerinde çalışmaya başladım, ancak Python'un ASCII dışı karakterler ve uzun çizgilerle ilgili tuhaflıklarını çözmek biraz zaman aldı. Python'un bir seferde 8191 bayt satır okuduğunu ve bu 8191 baytın çok baytlık bir karakterin yalnızca bir bölümünü içerdiğini keşfettim, Python bir SyntaxError atar .

İlk snippet, Turing Completeness için En Az (farklı) karakterden bir kodlama kullanır .

exec('%c'%(111+1)+'%c'%(111+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+11)+'%c'%(111+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+11)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(111)+'%c'%(111+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+11)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+1+1)+'%c'%(111+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+1)+'%c'%(11+11+11+11+1+1+1+1+1)+'%c'%(11+11+11+11+1+1+1+1+1+1)+'%c'%(11+11+11+11+11)+'%c'%(11+11+11+11+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1++++++++++1))

Bu canavarlık sadece aşağıdaki dizgeyi oluşturuyor ve yürütüyor.

print(len(open(__file__).read())-1260)

Aşağıdaki snippet'lerin tümü bir karakter uzunluğundadır. Önümüzdeki üç karakter \n, \rve #. Kalan tüm Unicode karakterler (yedekler hariç) belirli bir sıra izler, 8191 bayt sınırına göre sıralanırlar.

Aşağıdaki komut dosyası 1 ile 1112056 arasında k girişi için uygun programları oluşturur .

j = 4
s = "exec('%c'%(111+1)+'%c'%(111+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+11)+'%c'%(111+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+11)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(111)+'%c'%(111+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+11)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+1+1)+'%c'%(111+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1+1)+'%c'%(11+11+11+11+11+11+11+11+1+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+11+11+11+11+11+1)+'%c'%(11+11+11+1+1+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1+1)+'%c'%(11+11+11+11+1)+'%c'%(11+11+11+11+1+1+1+1+1)+'%c'%(11+11+11+11+1+1+1+1+1+1)+'%c'%(11+11+11+11+11)+'%c'%(11+11+11+11+1+1+1+1)+'%c'%(11+11+11+1+1+1+1+1+1+1++++++++++1))"
l = 1
c = \
        [
                None,
                [n for n in range(0x80) if chr(n) not in "\n\r#%'()+1cex"],
                [*range(0x80, 0x800)],
                [*range(0x800, 0xd800), *range(0xe000, 0x10000)],
                [*range(0x10000, 0x110000)]
        ]

k = int(input())
assert k in range(1, 1112057)
s += '\n\r#'[:k - 1]
k -= 4

while j:
                while k > 0 and c[j] and l + j < 8191:
                        s += chr(c[j].pop())
                        l += j
                        k -= 1
                if k < 1:
                        print(end = s)
                        break
                elif c[j] == []:
                        j -= 1
                else:
                        s += chr(c[8191 - l].pop())
                        print(end = s)
                        k -= 1
                        s = ''
                        l = 0

4
Hiç kaybettin mi?
Patrick Roberts

256'dan daha fazla nasıl puan kazandığınız konusunda kafam karıştı. Farklı unicode karakterler farklı karakterler mi? Öyleyse neden sonsuz bir puan elde etmek için birleştirici aksan kullanmıyorsunuz?
Buğday Sihirbazı

@WheatWizard Karakter nedir?
Dennis

Görünüşe göre bu tanım ile daha yüksek bir puan almak için aksanları birleştirerek kullanabilirsiniz.
Buğday Sihirbazı

@WheatWizard Hayır, bir harf artı birleştirme aksanlı iki Unicode karakterdir.
Dennis

13

Perl 5, 50,091 151 parçacığı

İlk pasaj:

use utf8; print length A

26 ila 2. snippet'ler: BarasıZ

27 46nd snippet'leriyle yoluyla: aaracılığıyla z"uzunluk" karakterler hariç

47. ila 56. snippet'ler: 0ila9

57. snippet: _

Kalan snippet'ler, Perl'in ilk snippet'teki 14 farklı kelime karakteri hariç herhangi bir sırada "kelime" karakterleri olarak gördüğü 50.105 ayrı Unicode karakteridir.

Güzel bir düşünceydi, ancak belli bir süre sonra Perl'in size "çok uzun bir tanımlayıcı" hatası verdiği ortaya çıktı. Bu, Perl'in hazmetmesini sağlayan en uzun kombine programdır:

use utf8; print length A012345679BCDEFGHIJKLMNOPQRSTUVWXYZ_abcdjkmoqsvwxyzĀāĂ㥹ĆćĈĉĊċČčĎďĐđĒēĔĕĖėĘęĚěĜĝĞğĠġĢģĤĥĦħĨĩĪīĬĭĮįİıIJijĴĵĶķĸĹĺĻļĽľĿŀŁłŃńŅņŇňʼnŊŋŌōŎŏŐőŒœŔŕŖŗŘřŚśŜŝŞşŠšŢţ

Perldiag kılavuz sayfası, "Perl'in gelecekteki sürümlerinin bu keyfi sınırlamaları ortadan kaldırması muhtemeldir" diyor, ancak Perl 5.18 bunu yapmadı.

Açıklama:

Katı olmayan modda, Perl 5, kelime karakterlerinin alıntılanmamış dizgilerini "korkak" olarak yorumlar, esasen sizin için otomatik olarak alıntı yapar. Genelde kaçınılması en iyisidir ancak burada yardım aldıklarından eminler!


4
Kişisel a-zparçacıkları büyük olasılıkla ilk pasajımızdaki karakterleri kullanacaktır.
Jonathan Frech

Evet gerçekten, teşekkürler. Sabit.
Sean,

"Vitrin" benzeri bir cevap vermenizi öneririm, çünkü hemen hemen tüm (exo) saçakları - jöle, pyth, vb - bu davranışı var
Rod

"Vitrin benzeri cevap" ın ne anlama geldiğini bilmiyorum.
Sean,

1
@Sean Plenty, esolangs.org'da bulunabilir ve bu yaklaşım çalışmak için tam bir anlayış gerektirmediğinden, siteden ihtiyacınız olanı öğrenebilirsiniz. Ayrıca, pek çok esolan olmayan bu davranışı sergiler; örneğin, TI-BASIC'in ilk snippet'i olacaktır length("length(.
Khuldraeseth na'Barya

10

Python 2 , skor 32

for r in range(32):locals()[''.join(map(chr,range(65,66+r)[:26]+range(117,92+r)))]=r+1
print A

Sonraki snippet'lerle B, C, D, ... Y, Z, u, v, w, x, y,z .

Dramatik bir ironi ile Python 3, bu numara ile çok aptalca davranmamızı sağlayacak Unicode tanımlayıcılarını destekliyor. print parantez . Rakamdaki rakamları da tıkayabilirim, ancak bu yaklaşımın daha fazla sıkmak için çok eğlenceli olduğunu sanmıyorum.

Çevrimiçi deneyin!

Python 2 , skor 18, daha az hile-y

print 0x10-1&0x1
print 0x10-1&0x12
print 0x10-1&0x123
print 0x10-1&0x1234
print 0x10-1&0x12345
print 0x10-1&0x123456
print 0x10-1&0x1234567
print 0x10-1&0x12345678
print 0x10-1&0x123456789
print 0x10-1&0x123456789A
print 0x10-1&0x123456789Ab
print 0x10-1&0x123456789Abc
print 0x10-1&0x123456789Abcd
print 0x10-1&0x123456789AbcdE
print 0x10-1&0x123456789AbcdEf
print 0x10-1&0x123456789AbcdEf^((()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==()))
print 0x10-1&0x123456789AbcdEf^((()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==()))|[[[]]>[]][[]>[]]
print 0x10-1&0x123456789AbcdEf^((()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==())+(()==()))|[[[]]>[]][[]>[]]<<False**False

Çevrimiçi deneyin!


10

JavaScript (ES6, V8 6.x), 52 50298 119526 119638 119683 128781 pasajlar, 88 149147 575179 575631 576121 612789 bayt

Aşağıda, programın tamamını oluşturan, değerlendiren ve dosya için bir indirme bağlantısı oluşturan bir Yığın Parçacığı yer almaktadır. Bu kod parçası, Unicode'un sonraki sürümleri, daha yeni JavaScript sürümleri tarafından desteklendiğinden, dile yeni geçerli tanımlayıcılar ekleyerek devam edecektir.

Yalnızca ASCII’yi kullanma

console.log(new Proxy({},{get:(n,{length:e})=>e>>(e/e)}).nn$$00112233445566778899AABBCCDDEEFFGGHHIIJJKKLLMMNNOOQQRRSSTTUUVVWWXXYYZZ__aabbccddffiijjkkmmppqqssuuvvzz)

açıklama

Bu , nesnede Proxybir işleyici yakalama tuzağını etkinleştirmek ve özellik adına bir dizge olarak erişmek ve tanımlayıcının değerini döndürmek için metaprogramlama tekniğini kullanır.length / 2 değeri olarak .

İlk snippet olarak başlarken new Proxy({},{get:(n,{length:e})=>e>>(e/e)}).nn, eklenen her bir snippet length, aşağıdakileri 2yaptığından emin olarak , tanımlayıcının dizesini artırır ..repeat() 2 byte utf-16 karakter için iki kez ilgili kod noktasından ve 4 byte utf-16 karakter için bir kez ilgili kod noktasından .

JavaScript'teki tanımlayıcılar

In ECMAScript Şartname , bir IdentifierNamesonraki dilbilgisi ile tanımlanır:

IdentifierName::
  IdentifierStart
  IdentifierName IdentifierPart

IdentifierStart::
  UnicodeIDStart
  $
  _
  \UnicodeEscapeSequence

IdentifierPart::
  UnicodeIDContinue
  $
  _
  \UnicodeEscapeSequence
  <ZWNJ>
  <ZWJ>

UnicodeIDStart::
  any Unicode code point with the Unicode property “ID_Start”

UnicodeIDContinue::
  any Unicode code point with the Unicode property “ID_Continue”

Cevabı üretmek

Başlangıçta "ID_Continue" Unicode özelliğini kullanarak, tam cevabı oluşturan bir Node.js betiği yazdım. Artık eval()geçerli karakterleri test etmek için bir naif kullanan , bunun yerine tüm unicode kod noktalarını yineleyen bir istemci tarafı komut dosyası var :

// first snippet
let answer = 'new Proxy({},{get:(n,{length:e})=>e>>(e/e)}).nn'

const used = Array.from(
  answer,
  c => c.codePointAt(0)
).sort(
  (a, b) => a - b
)

// create a O(1) lookup table for used characters in first snippet
const usedSet = Array.from(
  { length: Math.max(...used) + 1 }
)

for (const codePoint of used) {
  usedSet[codePoint] = true
}

// equal to 1 for first snippet
let snippets = eval(answer)
let identifier = ''

for (let codePoint = 0, length = 0x110000; codePoint < length; codePoint++) {
  const character = String.fromCodePoint(codePoint)

  // if unused
  if (usedSet[codePoint] === undefined) {
    // if valid `IdentifierPart`
    try {
      eval(`{let _${character}$}`)
    } catch (error) {
      // console.log(character)
      continue
    }

    // repeat so that `snippet.length === 2`
    identifier += character.repeat(2 / character.length)
    snippets++
  }
}

// number of snippets generated
console.log(`snippets: ${snippets}`)

const program = `console.log(${answer + identifier})`

// output of program to validate with
eval(program)

// download link to check number of bytes used
dl.href = URL.createObjectURL(new Blob([program], { type: 'text/javascript' }))
<a id=dl download=answer.js>Click to Download</a>

Çalışan stat -f%z answer.js, 612802 bayt sayısını verir, ancak console.log(ve için 13 bayt çıkarırız.) gerçek gönderimi paketlenmesi .

Kodlama

Kaynak, cevabın çok büyük bayt sayısına yansıyan utf-8 olarak depolanır. Bu yapılır çünkü Node.js sadece utf-8 ile kodlanmış kaynak dosyaları çalıştırabilir.

JavaScript dahili olarak utf-16 kodlu dizeleri saklar, bu yüzden JavaScript'te döndürülen "karakter uzunluğu" aslında utf-16'da kodlanan dizenin bayt sayısının yarısı kadardır.


Neden bir ekstra tanımlayıcı karakter olarak serbest bırakmak xyerine , söylemiyorsunuz $?
Neil

@Neil Bunu bir süre önce farkettim. Şu anda ~ 119519 olan bir cevap üzerinde çalışıyorum. Şimdilik sadece kodlamayı doğru bir şekilde geçme meselesine indirdim.
Patrick Roberts

Etrafta yattığım Spidermonkey JS kabuğunun bir kopyasını denedim. Yalnızca 50466 farklı tanımlayıcı karakteri destekledi. (İlk snippet'inizde 12 kullandığınızdan, bu puanınız 50455'tir.)
Neil

Eh, büyük bir revizyon yapmadan, skor 50297 olması gerekecek gibi görünüyor. Şimdi cevabı yazmak. Açıkçası, ESico + 'da Unicode 10.0.0 özelliğini kullanan 128.096 destekli tanımlayıcılar mevcut, ancak bunlardan sadece bahsettiğiniz rakamın 1 karakter uzunluğunda olması gerekiyor. Ben buna asıldım.
Patrick Roberts

1
@PatrickRoberts Üzgünüm, benim hatam, bunu okurken, sonuna kadar bir tanesi sadece metin ile çarpılana kadar tüm metni kabul ettim. Gözlerim o kısmı atlamış olmalı.
Conor O'Brien,

6

Python 2 , puan 6 10

WheatWizard sayesinde pizzapants184
+1 sayesinde +3

4/4
*2
-~0
+1
|5
^3
&776%6
and 8
if[]else[9][9>9]
.__xor__((""=="").__xor__((""=="")<<(""=="")))

Çevrimiçi deneyin!


Eğer print int(True)sadece değiştirirseniz , numarayı basmanız gerekmediği sürece 7 için 4/4ekleyebilirsiniz and 7, sadece 'üretin'
pizzapants184


Ekleme &2, puanınızı bir artıracaktır çünkü &önceliğinden daha yüksek önceliğe sahiptir ^, ancak 2 sayısını bir şekilde yapmanız gerekir. (Kullanabilirsiniz [[]==[]][[]<[]]<<[[]==[]][[]<[]])
Buğday Sihirbazı

1
@ pizzapants184 Ne olursa olsun bu 10 için çalışıyor.
Buğday Sihirbazı

1
@ pizzapants184 ordile çelişiyordu and, ama ben düzelttim
Rod

6

TI-Basic (83 serisi, işletim sistemi sürümü 1.15 veya üstü), puan: 17 18 19 24

(Tiebreaker: 53 bayt.)

Dize uzunluğunu her zamanki gibi suistimal ederek çok büyük bir puan alabilirsiniz: ile başlayın (@Scrooble'ın işaret ettiği gibi) ve sonuna kadar tek nokta parçacıkları eklemeye devam edin. TI-Basic'in 700'den fazlası var, bu yüzden gerçekten iyi çalışıyor. Ama işte başka bir yaklaşım:length("A length("length(

int(log(11
2
3
4
5
6
7
8
9
0
Xmax
Ymax
nMax
abs(Xmin
Ymin
ππ
eee
³
²
₁₀^(₁₀^(X
+e^(⁻e^(Y))))
/√(sub(Z!
°
randrandrand

Not TI-Temel simgeleþtirilmiþ olduğunu, bu nedenle (örneğin) e^(komutu karakterlerden herhangi kullanmaz e, ^, (.

sub(Komutun belgelenmemiş özelliğine güvenir : alt dizeleri bulmaya ek olarak, bir sayıyı 100'e bölmek için de kullanılabilir.

Bu eserler o sağlayan bir taze hesap makinesi, üzerinde çalışan eğer bize farz X, Y, Zpencere değişkenler hesap radyan modunda olduğunu, onların standart değerlerine ayarlanmış olduğundan ve bu, hepsi sıfır randilk üç çıkışları hakkında olacak 0.943, 0.908, 0.146.


4

PowerShell , 25 bayt, Puan 5

' '.count*2+!""-(-1)|%{5}

Snippet 1: ' '.countçıkışlar 1. Bunu .counttek bir dize olduğu için bir dize alarak yapabilirsiniz . Çevrimiçi deneyin!

Snippet 2: *2çıktılar 2çünkü 1önceki snippet'ten çıktık ve iki ile çarptık. Çevrimiçi deneyin!

Snippet 3: boş bir dizginin Boole değerini ekleyerek +!""çıktı verir 3. Bu, örtük $trueolarak tekrar boşaltılan boş dizgiyi yayınlar 1, bu yüzden çevrimiçi bir tane ekliyoruz !

Snippet 4: Negatif olanı çıkararak -(-1)çıktılar Çevrimiçi deneyin!4

Snippet 5: önceki sayıyı bir döngüye alarak |%{5}çıktılar 5ve bu döngünün her yinelemesini (yalnızca bir, çünkü yalnızca bir giriş numarası vardır) çıktılar 5 Çevrimiçi deneyin!

Alternatif bir gelme aracı ve gelip 4kurnazca bir yol için Jan için teşekkürler 5.


' '.count*2+!""-(-1)|%{5}5 puan almaya ne dersiniz ?
Ocak

@Jan Ah, doğru, haha, aslında $_içinde kullanmana gerek yok |%{ }. Teşekkürler!
AdmBorkBork

4

C, 10 pasajlar, 45 bayt

sizeof(char)              // sizeof(char) = 1
<<9/9                     // Multiply by two.
|1                        // 2 or 1 = 3
,4                        // Discard previous expression, return 4.
+!!8                      // Add one.
^3                        // 5 xor 3 = 6
&66                       // 3 and 66 = 2, 5 xor 2 = 7 (& has higher precedence)
??'0xF                    // Trigraph for '^'. 7 xor 15 = 8
-~-2                      // ~-2 = 1, 7 xor 14 = 9
*57%5                     // 1*57%5 = 2, 7 xor 13 = 10

Çevrimiçi deneyin!


4

MATL , Puan 8 15, 64 123 bayt

rg             % 1 Random number, make boolean (1)
Q              % 2 Increment
Yq             % 3 Nth prime
a,E]           % 4 any (convert to boolean 1. Do twice: Multiply by 2
T+             % 5 Add True
F~_-           % 6 Subtract negative (not(false)) = 6-(-1)
:sI/           % 7 Range 1:6, sum (21), divide by 3
A8*            % 8 All elements (True). Multiply by 8
d9             % 9 Clear stack, push 9
x10            % 10 Clear stack, push 10
WBPf           % 11 Raise 2^10. Convert to binary [1 0 ... 0], flip [0 0 ... 1]. Find
23ZP           % 12 Push 23, and calculate the distance between 11 and 23
yyyyyyyyyyyyyyyyyyyyyyyyhhhhhhhhhhhhhhhhhhhhhhhhz  % 13. Duplicate and count elements
tttttttttttttvvvvvvvvvvvn  % 14 Duplicate and count elements
OOOOOOOOOOOOOON&           % 15 Add bunch of zeros, output size of stack
  • Luis Mendo'nun yardımlarıyla 12'ye çıktım! Snippet 7'yi 11,23ZPdeğiştirmekle 3birlikte kullanmak onun fikriydi I.
  • Luis'den daha fazla yardımla 15'e çıktım. OO...N&onun fikriydi.

Gelmek için daha fazla. MATL'nin yürekten çalıştığını bilmiyordum, bu yüzden belgelerde ileri geri ileri geri gitmek zorunda kaldım ... :)

Çevrimiçi deneyin!


Ooh, 5Yy is nice! I already use Y in 3 to get the second prime :(
Stewie Griffin

I think you can get another one with OOOOOOON&. If you add others, this should probably be the last, because of &
Luis Mendo

Thanks again Luis! Also, why did I need soooo many yyyyyyyy...? I had to double the number, 24 y to get it duplicated 12 times...?
Stewie Griffin

@Stewie I think it is because half the elements you are duplicating are the empty array generated by d. I'm on mobile now, but try X# to debug-print the stack
Luis Mendo


2

Jelly, 253 bytes, score 250

L}“L

Subsequent 1-char snippets:

¡¢£¤¥¦©¬®µ½¿€ÆÇÐÑ×ØŒÞßæçðıȷñ÷øœþ !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|~¶°¹²³⁴⁵⁶⁷⁸⁹⁺⁻⁼⁽⁾ƁƇƊƑƓƘⱮƝƤƬƲȤɓƈɗƒɠɦƙɱɲƥʠɼʂƭʋȥẠḄḌẸḤỊḲḶṂṆỌṚṢṬỤṾẈỴẒȦḂĊḊĖḞĠḢİĿṀṄȮṖṘṠṪẆẊẎŻạḅḍẹḥịḳḷṃṇọṛṣṭụṿẉỵẓȧḃċḋėḟġḣŀṁṅȯṗṙṡṫẇẋẏż

Note: may also be replaced by \n, they're the same byte in Jelly's codepage.

After you append all those snippets, you can then append the 2-char snippet ”‘.

+1 thanks to Dennis.

Try it online!


2

Lenguage, 1 112 064 snippets

The nth snippet consists of 23n-1 repetitions of the nth non-surrogate Unicode character, up to and including the 1 112 064th and last non-surrogate character of the current Unicode standard.

Output is in unary (using the null byte as digit) for simplicity. Decimal is possible, but it will make the programs even longer. With unary, we can test the first programs.

For n = 1, we get 4 repetitions of U+0000. This is equivalent to the brainfuck program ., which prints one null byte.

For n = 2, we get 32 repetitions of U+0001, for a total of 36 characters. This is equivalent to the brainfuck program .., which prints two null bytes.

For n = 3, we get 256 repetitions of U+0002, for a total of 292 characters. This is equivalent to the brainfuck program ..., which prints three null bytes.

And so forth, up to n = 1 112 064.


Can you demonstrate or argue the equivalent in decimal? I'm not sure about the consensus on unary output but I believe it's for languages lacking concept of decimal—at least, last I checked
Conor O'Brien

I believe it's for languages lacking concept of decimal Yes, and since Lenguage doesn't have decimal I/O, I assumed it was fine. Anyway, encoding the brainfuck program '+'*(48 + d) +'.>' for each decimal digit of n would achieve the same score. It's just a lot harder to describe.
Dennis

I see. Same thing just longer.
Conor O'Brien

2

BASIC (ZX Spectrum), score 244 (new score 247) [is this cheating?]

Snippet 1:

2356 PRINT PEEK (PEEK 23635+256*PEEK 23636+2)+256*PEEK (PEEK 23635+256*PEEK 23636+3)-56-66

Snippet 2: :

Snippet 3: REM

Snippets 4-244: Single-character snippets, using all characters not in snippets 1, 2 and 3.

Explanation

Characters

On Spectrum, PRINT is a single character (code 245). The snippet 1 uses 11 different characters: 2, 3, 5, 6, +, -, *, (, ), PRINT and PEEK What you see as spaces are a part of characters PRINT and PEEK, so the space itself hasn't been used. I decided to give the line number 2356 because these are the only digits present in the code.

Characters 13 and 14 are not allowed. That means there are 243 characters left for snippets 2-244, starting with : and REM to avoid the code that would produce error or do anything else.

How it works

This is why I'm not sure whether this answer is by the book.

23635 is the memory location for 16-bit system variable PROG, stored as LH. (The value is usually 23755. But apart from wrong result if it happens not to be the case, using this number directly, even though it would shorten the code, would cost me extra digit characters.) The value of PROG is the memory location where the program itself is stored. The first two bytes are the line number stored as HL, the following two bytes are the length of the line stored as LH. That's how the program looks up its own line's length, so something appropriate needs to be subtracted

Saving characters

Considering how numbers are stored, the line could have ended with -114 so that snippet 1 would produce 1. But I didn't want to use extra digits, so I instead took away two 2-digit numbers, which then had to add up to 122; 56 and 66 did nicely.

The code is a bit ugly with all nesting and calculating value of PROG (PEEK 23635+256*PEEK 23636) twice. But if I stored it and then used the stored value, it would cost extra characters / snippets - the line could start like

2356 LET p=PEEK 23635+256*PEEK 23636: PRINT PEEK (s+2)...

which would use 4 additional characters: LET, p, = and :.

Maybe I'll engineer this so that all numbers are calculated from numbers that use only 1 digit and gain 3 snippets.

EDIT:

Here is the new snippet 1 (that's how a long single line gets wrap-displayed on the Spectrum, so if you want to test the code , that will help you see that you typed it correctly):

1111 PRINT +PEEK (PEEK (11111+11
111+1111+(1+1+1)*(111-11)+1+1)+(
111+111+11+11+11+1)*PEEK (11111+
11111+1111+(1+1+1)*(111+1-11))+1
+1)+(111+111+11+11+11+1)*PEEK (P
EEK (11111+11111+1111+(1+1+1)*(1
11-11)+1+1)+(111+111+11+11+11+1)
*PEEK (11111+11111+1111+(1+1+1)*
(111+1-11))+1+1+1)-111-111-111-1
11-111-111

I could gain another snippet by avoiding the + and just make do with -. I'm not going to try it, this was enough of an ordeal.


2

Klein 011, 9 snippets

Snippet 1

!@1!aaaaaaaaaaaaaaaaaaaaa/a

Try it online!

Snippet 2

2((2|bbb0b2bbbb4bbbbbbbb

Try it online!

Snippet 3


c\*3ccccccccccccccccccccc\ccccccccc3c6cccc9
c\

Try it online!

Snippet 4

ddddddddddddddddddddddd>$d:d:++-$:+:+++$:?:-$-+++

Try it online!

Snippet 5

ee

Try it online!

Snippet 6

fff

Try it online!

Snippet 7

ggggg

Try it online!

Snippet 8

hh

Try it online!

Snippet 9

iiiii

Try it online!

Explanation

This was a really fun challenge for Klein. Klein's unique topology allows for a lot of interesting stuff to be done. As you might notice answers 5-9 are just adding filler (letters do nothing in Klein so I used them as filler) to the code to stretch out the bounding box. This causes the ip to take a different path through earlier parts of the code because of Klein's unique topology.

I'm going to make a full explanation later, but for now here is a easier to understand version of the program with all of the letters replaced with .s.

!@1!...................../.2((2|...0.2....4........
.\*3.....................\.........3.6....9
.\.......................>$.:.:++-$:+:+++$:?:-$-+++.................

Try it online!


2

><>, Score: Infinity 1,112,064-6 = 1,112,058

Snippet 1 (6 bytes)

"l4-n;

This snippet outputs the amount of characters after the ; plus one. This can be extended to infinite very large amount of snippets of one character each. A quick google tells me there are 1,112,064 possible Unicode characters, minus the 6 I’ve already used.

Try It Online


1

R, score: 79

Credit to Sean's Perl answer for the inspiration; this abuses some quirks of the R interpreter.

First snippet:

nchar(scan(,""))
a

subsequent snippets are the characters in:

bdefgijklmopqtuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789`~!@$%^&*_+|\[]{}:?><;

Try it online!

The scan function reads data from the file "" which defaults to stdin().

The docs for stdin() indicate that:

When R is reading a script from a file, the file is the ‘console’: this is traditional usage to allow in-line data (see ‘An Introduction to R’ for an example).

Hence, the subsequent data become the file. This can be trivially expanded, and can work with multiple different encodings.


1

Pyke, 256 bytes, score 254

Please note that these are hex codes of the actual bytes, separated by spaces, since there the null byte (\x00) is included.

Starting snippet:

6C 22 00

Subsequent 1-char snippets:



Try it here!


1

Java 8, 7 snippets (19 bytes)

1
*2
-~0
>4?4:4
|5
^3
7%7

Just a start, will continue working on it.

Try it here.

Explanation:

Execution precedence is perhaps made clearer when I add parenthesis:

((1*2)-~0)>4?4:4|(5^(37%7))
  • a*b: Multiply a with b
  • ~a: -a-1
  • a>b?x:y: if(a>b){ x }else{ y }
  • a|b: Bitwise-OR a with b
  • a^b: Bitwise-XOR a with b
  • a%b: a modulo-b

1

Python 2, 110 snippets

Here is the complete snippet:

print((((len(open(__file__).read())-44.))))

#	 !"$%&'*+,/012356789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^`bcghjkmqsuvwxyz{|}~

Try it online!

The first snippet is

print((((len(open(__file__).read())-44.))))

And then the next 109 snippets are the next 109 bytes.

This is pretty "cheaty" as Lynn puts it. The first snippet opens the file and subtracts 44 from its length, then each other snippet adds 1 to the length of the file without changing the logic of the program as a whole. thus increasing the result of the output by 1.


1

dc, score 13, 58 bytes

I3%                   #I is the default input radix, 10, mod 3 yields 1
1+                    #Add one
2^2^2^Z               #2^8=256, Z pushes the number of digits to the stack
6*v                   #Square root of 18 = ~4.24, at precision 0 we get 4
c5                    #Start getting lazy, clear the stack and push 5
_F-E-                 #Subtract negative 15, then subtract 14
ss7                   #Lazy, 'drop' the value by storing it, push 7
SS8                   #Lazy, 'drop' the value by storing it, push 8
d::9                  #Lazy, 'drop' the value by storing it, push 9
;;kA                  #Recall element 9 from nonexistant array ; which is zero, set precision, push A (10)
iB                    #Set input radix to 10, push B (11)
oD                    #Set output radix to 11, push D (13, or 12 in base 11)
 4CCCCCCr/4C/CC/4/    #We have division and the digits 4 and C left, this might not be the optimal way to get us to 13 but it does the job

Try it online! (Note, the TIO version adds an f after each snippet to print the entire stack, showing that each snippet only leaves a single value on the stack; also I forgot the leading space on the last snippet which doesn't matter functionally when they're broken apart by line breaks but does count to my character usage)

Each additional snippet concatenation leaves the desired value and only the desired value on the stack. After hitting 12, I had kind of run out of ways to eat the stack. I tried to use math operations early on since they gobble up the stack and as we get into larger numbers it gets trickier to manage that way. When all is said and done, I have only the digit 0 left to play with and very little in the way of stack-popping, so I think 13 is pretty close to maxed out. I'm sure there are many similar (and likely shorter) ways of accomplishing this in dc, this just kind of fell into place. Note that cygwin handles A-F mixed in with 0-9 differently from most versions of dc, 44C4r/CC 4// works for the final snippet in cygwin.


0

Pyth, 124 snippets

l"x00x01x03x04x05x06x07x08
x0bx0c
x0ex0fx10x11x12x13x14x15x16x17x18x19x1ax1bx1cx1dx1ex1f !#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijkmnopqrstuvwxyz{|}~x7f

Try it online!

Unprintable characters where escaped using three printable characters (x..). The first snippet is three bytes long, every snippet after that grows in length by one.


0

Beatnik, 22 bytes, score 20

K A
E
I
L
N
O
R
S
T
U
a
e
i
l
n
o
r
s
t
u

Assuming the word "snippet" allows you to push the value on the stack.


0

Octave, Score 86

nnz n

Followed by:

!$&()*+./0123456789:<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmopqrstuvwxy{|}~

This exploits the fact that Octave treats everything after a function name as a string input. So nnz n returns the number of non-zero elements in the string 'n'. We get to 86 by adding the other printable ASCII-characters. ',"%# doesn't work.



0

Julia 0.6, 111217

The following script creates the full program:

A = "macro length(a);length(string(a))end;@length a"
B0 = join(([Char(x) for x in Iterators.flatten((0x000001:0x00d7ff, 0x00e000:0x10ffff)) if Base.isvalid(Char(x)) && Char(x) ∉ A && Base.isidentifier("a$(Char(x))") ]));
B = normalize_string(B0, stripmark=true, decompose=true);
B = join(unique(b for b in B))
while (n = search(B, '·')) > 0
    B = B[1:prevind(B,n)]*B[nextind(B,n):end]
end
while (n = search(B, '`')) > 0
    B = B[1:prevind(B,n)]*B[nextind(B,n):end]
end

open("concount.jl", "w") do f
    write(f, A)
    write(f, B)
end

Explanation

The macro

 macro length(a);length(string(a))
 end
 @length a

followed by all distinct unicode characters allowed in identifiers, computed with isidentifier. Some diacritial marks mess up counting so I removed them.


0

TeX, score 61 (possibly 190)

First snippet:

\def\len#1{\expandafter\glen\string#1=}
\def\glen#1{\tlen}
\def\tlen#1{\if#1=\let\tlen\end\number\count1\else\advance\count1by1\fi\tlen}
\count1=-1
\catcode33=11
\catcode34=11
\catcode36=11
\catcode37=11
\catcode'46=11
\catcode40=11
\catcode41=11
\catcode42=11
\catcode43=11
\catcode44=11
\catcode45=11
\catcode46=11
\catcode47=11
\catcode56=11
\catcode57=11
\catcode'72=11
\catcode'73=11
\catcode60=11
\catcode62=11
\catcode63=11
\catcode64=11
\catcode'133=11
\catcode'135=11
\catcode'136=11
\catcode'137=11
\catcode'140=11
\catcode124=11
\catcode126=11
\len\t

Other 60 snippets: in any order, each containing one character out of

!"$%&()*+,-./:;<>?@[]^_`|~89ABCDEFGHIJKLMNOPQRSTUVWXYZhjkqwz

Explanation: \len, which is invoked at the end, converts a control sequence into a string, each character (including \) is one character token of that string; then \glen gobbles token \, then \tlen counts remaining tokens. It therefore outputs the length of that control sequence (not including \).

Characters from other snippets extend the control sequence which is initially just \t. A multi-character control sequence has to be made up of letters only, but they all count as letters because they have all been assigned category code 11 (using ASCII codes so that the characters themselves don't appear in the first snippet).

I decided to use octal codes for some characters which cost me one symbol, ' but saved me two digits, 8 and 9, so I gained one snippet. Possibly could have gained a couple more if I didn't need \expandafter.

Output

Possible alteration: wrap \number\count1 into \message{} so the output doesn't go into .dvi output but instead to console output and .log. It doesn't cost any extra letters.

190

Unfortunately TeX works with ASCII and not Unicode (or does it now?), but my solution could possibly be extended to include 129 more single-character snippets containing the characters with codes 127-255. Maybe even some characters before 32. Character 32 (space) didn't work, otherwise I'd put it into a snippet as well - didn't need it in the first snippet. Of course, each of these additional characters would have to be \catcoded into a letter in the first snippet.


0

Pip, 57 bytes, score = 16

!u
2
RT9
#m
5
(EX3Y8)
7
y
A'<tab>
t
11
+o
-v
PI@`\...`@`..$`
"F"FB:4*4
Ok=k6

Note that <tab> represents a literal tab character (ASCII 9). Try it online!

Each snippet is a full program that outputs the desired number. Most of them work on the principle that the last expression in a Pip program is autoprinted: for example, in snippet 5, the previous code is evaluated, but the only part that matters is the 5. Exceptions to this are:

  • Snippet 3 works fine in isolation as RT9 (square root of 9), but coming after snippet 2 it actually parses as 2RT9 (2nd root of 9)--which, of course, amounts to the same thing.
  • Snippet 6 gets the 8th character (0-indexed) of e^3, which happens to be 6. But it also yanks the number 8 into the y variable. Snippet 8 then outputs the value of y.
  • Snippet 12 takes the 11 from the previous snippet and adds o (preinitialized to 1). Snippet 13 takes that result and subtracts v (preinitialized to -1).
  • Snippet 16 outputs 1 without a newline (Ok=k, where k=k evaluates to the default truthy value of 1), and then autoprints 6.

Other interesting stuff:

  • Snippet 14 uses regex operations to extract 14 from the value of pi.
  • Snippet 15 converts the string "F" from hexadecimal.

0

Zsh, score >50 000 (1 112 046?), 16 + Σ(UTF-8 codepoint lengths) bytes

exec echo   $((${#:-$(<$0)}-33))
#

Zsh handles multibyte encodings by default. The base snippet has 18 unique characters, 34 total. Every other codepoint (save for the null byte) can be added onto this. As I write this, my script testing these is on codepoint ~50 000, total file size 150K, going at about 30 snippets/second. Run my full test script yourself here. You may want to adjust it to start at some later codepoints.

Try the first 2000 snippets online!

More snippets are possible by using this technique.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.