Ordem principal de linha e de coluna

Fonte: testwiki
Revisão em 09h18min de 4 de novembro de 2022 por imported>Conde Ed Dantes (Remoção de afluente(s) de página(s) eliminada(s), replaced: IRIS GL → IRIS GL)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa
Ilustração da diferença entre a ordem principal de linha e de coluna

Na computação, ordem principal de linha e ordem principal de coluna são métodos para armazenar arranjos multidimensionais em armazenamento linear, como no caso da memória de acesso aleatório.

A diferença entre as ordens reside em quais elementos de um arranjo são contíguos na memória. Na ordem principal de linha, os elementos consecutivos de uma linha residem um ao lado do outro, enquanto o mesmo se aplica a elementos consecutivos de uma coluna na ordem principal de coluna. Enquanto os termos aludem à linhas e colunas de um arranjo bidimensional, ou seja, uma matriz, as ordens podem ser generalizadas para arranjos de qualquer dimensão, observando que os termos pricipal de linha e principal de coluna são equivalentes, respectivamente, a ordens lexicográficas e colexicográficas.

O layout de dados é crítico para a transmissão correta de arranjos entre programas escritos em diferentes linguagens de programação. Ele também é importante para o desempenho ao percorrer um arranjo, porque as CPUs modernas processam dados sequenciais com mais eficiência do que dados não sequenciais. ​Isso se deve principalmente ao armazenamento em cache da CPU, que explora a localidade espacial de referência.[1] Além disso, o acesso contíguo possibilita o uso de instruções SIMD que operam sobre vetores de dados. Em algumas mídias, como fitas ou memórias flash NAND, o acesso sequencial é mais rápido, em ordens de magnitude, do que o acesso não sequencial.Predefinição:Citation needed

Explicação e exemplo

Os termos principal de linha e principal de coluna derivam da terminologia relacionada à ordenação de objetos. Uma maneira geral de ordenar objetos com muitos atributos é primeiro agrupá-los e ordená-los por um atributo e, em seguida, dentro de cada grupo, agrupá-los e ordená-los por outro atributo, etc. Se mais de um atributo participa do pedido, o primeiro seria denominado principal e o último secundário. Se dois atributos participam do pedido, é suficiente nomear apenas o atributo principal.

No caso de arranjos, os índices ao longo de cada dimensão são os atributos. Para matrizes em notação matemática, o primeiro índice indica a linha, e o segundo indica a coluna. Por exemplo, dada uma matriz A, a1,2 está em sua primeira linha e segunda coluna. Esta convenção é transportada para a sintaxe em linguagens de programação,[2] embora, frequentemente, com índices começando em 0 (em vez de 1).[3]

Mesmo que a linha seja indicada no primeiro e a coluna no segundo (do índice), nenhuma ordem de agrupamento entre as dimensões está implícita nisso. A escolha de como agrupar e ordenar os índices, seja pelos métodos principais de linha ou de coluna, é, portanto, uma questão de convenção. A mesma terminologia pode ser aplicada a arranjos dimensionais ainda mais altos. O agrupamento principal de linha começa no índice "mais à esquerda" e o principal de coluna "mais à direita", levando, respectivamente, à ordens lexicográficas e colexicográficas (ou colex).

Por exemplo, o arranjo

A=[a11a12a13a21a22a23]

pode ser armazenado de duas maneiras possíveis:

Endereço Ordem principal de linha Ordem principal de coluna
0 a11 a11
1 a12 a21
2 a13 a12
3 a21 a22
4 a22 a13
5 a23 a23

Diferentes linguagens de programação lidam com isso de maneiras diferentes. Em C, os arranjos multidimensionais são armazenados na ordem principal de linha e os índices do arranjo são escritos primeiro em linha (ordem de acesso lexicográfico):

C: ordem principal de linha (ordem de acesso lexicográfico), indexação baseada em zero
Endereço Acesso Valor
0 A[0][0] a11
1 A[0][1] a12
2 A[0][2] a13
3 A[1][0] a21
4 A[1][1] a22
5 A[1][2] a23

Por outro lado, em Fortran, os arranjos são armazenados na ordem principal de coluna, enquanto os índices do arranjo ainda são escritos, primeiro, em linha (ordem de acesso colexicográfico):

Fortran: ordem principal de coluna (ordem de acesso colexicográfico), indexação baseada em um
Endereço Acesso Valor
1 A(1,1) a11
2 A(2,1) a21
3 A(1,2) a12
4 A(2,2) a22
5 A(1,3) a13
6 A(2,3) a23

Observe como o uso de A[i][j] com indexação de várias etapas (como em C) em vez de uma notação neutra como A(i,j) (como em Fortran), quase que inevitavelmente, implica em ordem principal de linha por razões sintáticas, por assim dizer, porque pode ser reescrito como (A[i])[j],e a parte da linha, A[i], pode até mesmo ser atribuída à uma variável intermediária que é, então, indexada em uma expressão separada. Nenhuma outra implicação deve ser assumida. Por exemplo, Fortran não é principal de coluna simplesmente "por causa" de sua notação e mesmo a implicação acima poderia ser intencionalmente contornada em uma nova linguagem.

Para usar a ordem principal de coluna em um ambiente de ordem principal de linha (ou vice-versa), por qualquer motivo, uma solução alternativa é atribuir funções não convencionais aos índices (usando o primeiro índice para a coluna e o segundo índice para a linha) e outra é contornar a sintaxe da linguagem computando explicitamente as posições em um arranjo unidimensional. Obviamente, o desvio da convenção provavelmente incorre em um custo que aumenta o grau de interação necessária com os recursos da linguagem e outros códigos, não apenas na forma de maior vulnerabilidade à erros (esquecendo também de inverter a ordem de multiplicação da matriz, revertendo para a convenção durante manutenção de código, etc.) mas também na forma de ter que reorganizar ativamente os elementos (todos os quais devem ser "pesados" em relação à qualquer propósito original, como aumentar o desempenho). A execução do loop por linha é preferível em linguagens principais de linha, como C, e vice-versa para linguagens principais de coluna.

Linguagens de programação e bibliotecas

Linguagens de programação ou suas bibliotecas padrão que oferecem suporte a arranjos multidimensionais, normalmente, têm uma ordem de armazenamento principal de linha ou coluna nativa para esses arranjos.

A ordem principal de linha é usada em C/C++/Objective-C (para arranjos de estilo C), PL/I,[4] Pascal​[5], SpeakeasyPredefinição:Citation needed, SAS[6] e Rasdaman[7].

A ordem principal de coluna é usada em Fortran, MATLAB,[8] GNU Octave, S-PLUS,[9] R,[10] Julia,[11] e Scilab.[12]

Nem principal de linha nem de coluna

Uma alternativa típica para armazenamento de arranjo densa é usar vetores Iliffe, que normalmente armazena elementos na mesma linha de forma contígua (como a ordem principal de linha), mas não as próprias linhas. Eles são usados em (ordenados por idade): Java[13], C#/CLI/.Net, Scala[14] e Swift.

Ainda menos denso é usar listas de listas, por exemplo, em Python [15] e na Wolfram do Mathematica'"[16].

Uma abordagem alternativa usa tabelas de tabelas, por exemplo, em Lua[17].

Bibliotecas externas

O suporte para arranjos multidimensionais também pode ser fornecido por bibliotecas externas, que podem até mesmo suportar ordenações arbitrárias, em que cada dimensão tem um valor de passo e principal de linha ou de coluna são apenas duas interpretações resultantes possíveis.

A ordem principal de linha é o padrão em NumPy [18] (para Python).

A ordem principal de coluna é o padrão em Eigen [19] e Armadillo (ambas para C++).

Um caso especial seria o OpenGL (e o OpenGL ES) para processamento gráfico. Uma vez que "tratamentos matemáticos recentes de álgebra linear e campos relacionados invariavelmente tratam vetores como colunas", o designer Mark Segal decidiu substituir isso pela convenção do predecessor IRIS GL (que era escrever vetores como linhas). Para compatibilidade, matrizes de transformação ainda seriam armazenadas em principal de vetor (o mesmo que principal de linha) em vez de ordem principal de coordenada (o mesmo que principal de coluna) e ele então usou o truque "[para] dizer que matrizes em OpenGL são armazenadas em ordem principal de coluna". [20] Isso era realmente relevante apenas para apresentação, porque a multiplicação da matriz era baseada em pilha e ainda podia ser interpretada como pós-multiplicação mas a realidade vazou através da API baseada em C porque os elementos individuais seriam acessados como M[vetor][coordenada] ou, efetivamente, como M[coluna][linha] (que infelizmente confundiu a convenção que o designer procurou adotar) e isso foi até preservado na OpenGL Shading Language que foi adicionada posteriormente (embora isso também possibilite acessar coordenadas por nome, por exemplo, M[vetor].y). Como resultado, muitos desenvolvedores agora simplesmente declararão que ter a coluna como o primeiro índice é a definição principal de coluna, embora este claramente não seja o caso com uma linguagem principal de coluna real como o Fortran.

Torch (para Lua) mudou a ordem padrão de principal de coluna[21] para principal de linha[22].

Transposição

Como a troca dos índices de um arranjo é a essência da transposição de arranjo, um arranjo armazenado como principal de linha, mas lido como principal de coluna (ou vice-versa), aparecerá transposto (desde que a matriz seja quadrada). Como realizar esse rearranjo na memória costuma ser uma operação cara, alguns sistemas oferecem opções para especificar matrizes individuais como sendo armazenadas transpostas. O programador deve, então, decidir se reorganiza ou não os elementos na memória, com base no uso real (incluindo o número de vezes que o arranjo é reutilizado em um cálculo).

Por exemplo, as funções BLAS recebem sinalizadores que indicam quais arranjos são transpostos[23].

Cálculo de endereço em geral

O conceito se generaliza para arranjos com mais de duas dimensões.

Para um arranjo d-dimensional N1×N2××Nd com dimensões Nk (k=1...d), um determinado elemento deste arranjo é especificado por uma tupla (n1,n2,,nd) de índices d (base zero) nk[0,Nk1].

Na ordem principal de linha , a última dimensão é contígua, de modo que o deslocamento da memória deste elemento é dado por:

nd+Nd(nd1+Nd1(nd2+Nd2(+N2n1))))=k=1d(=k+1dN)nk

Na ordem principal de coluna , a primeira dimensão é contígua, de modo que o deslocamento da memória deste elemento é dado por:

n1+N1(n2+N2(n3+N3(+Nd1nd))))=k=1d(=1k1N)nk

onde o produto vazio é o elemento de identidade multiplicativo, ou seja,=10N==d+1dN=1.

Para uma determinada ordem, o "dar passos longos" na dimensão k é dado pelo valor de multiplicação entre parênteses antes do índice n k nos somatórios do lado direito acima.

De forma mais geral, há "d!" ordens possíveis para um determinada arranjo, uma para cada permutação de dimensões (com principal de linha e ordem de coluna apenas 2 casos especiais), embora as listas de valores de passo não sejam necessariamente permutações entre si, por exemplo, no exemplo 2 por 3 acima, os avanços são (3,1) para principal de linha e (1,2) para principal de coluna.

Ver também

Predefinição:Referencias

Fontes