Contents

Por que não consegue medir o verdadeiro desempenho

Executar um benchmark pode ser bastante simples. Essencialmente, uma ferramenta de benchmarking é utilizada para realizar operações predeterminadas e medir o tempo necessário para conclusão. Além disso, considera vários fatores que podem impactar o desempenho, como recursos do sistema disponíveis e condições ambientais. Os resultados são então apresentados numericamente, fornecendo informações valiosas para fins de tomada de decisão.

Sob o pretexto de imparcialidade, o benchmark permite evitar a contemplação das aplicações potenciais da tecnologia. Simplesmente executando um programa e aceitando a saída gerada, os resultados são inseridos em uma tabela para comparação. Embora isto possa servir um propósito prático, frequentemente obscurece questões subjacentes.

/images/53384531845_b1b1de1df7_o.png

O resumo abrangente do NotebookCheck não requer repetição contínua de seu excelente processo de revisão.

A crença predominante é que um índice de referência de topo num ano pode não necessariamente manter a mesma posição nos anos subsequentes devido aos avanços na tecnologia e ao surgimento de alternativas superiores. Isto não significa que o produto anteriormente líder se tenha deteriorado; em vez disso, continua a desempenhar eficazmente a função pretendida. No entanto, com o tempo, este modelo outrora altamente conceituado pode ser considerado desatualizado por avaliadores objetivos que se concentram apenas nas capacidades funcionais sem considerar o contexto real de utilização dos dispositivos que estão a ser avaliados.

Um problema significativo com o benchmarking surge da maneira como os resultados são normalmente apresentados. Em vez de serem avaliadas com base em factores relevantes como custo, tamanho, ruído e consumo de energia, estas métricas são frequentemente avaliadas colectivamente de uma forma que prejudica os concorrentes. É análogo a comparar um computador em miniatura de baixo preço com uma estação de trabalho móvel altamente cara – uma comparação que carece de mérito. Além disso, benchmarks bem conhecidos tendem a se concentrar exclusivamente no desempenho computacional bruto, ao mesmo tempo em que apresentam uma miscelânea de soluções não relacionadas em formato de tabela. Esta abordagem ignora considerações importantes ao determinar a solução ideal para um determinado cenário.

/images/53384104451_dae938afbb_o.png

Porque é isso que esses testes não veem. Os compradores não escolhem com base em uma classificação, mas sim para atender a uma necessidade e a um orçamento. É claro que há interesse em colocar um computador contra outros e comparar máquinas do mesmo calibre. Isso pode fazer sentido. Mas, infelizmente, muitas vezes é difícil de ler. Apresentar máquinas do mesmo tamanho através de uma série de benchmarks é de pouco interesse. Se testarmos máquinas nas mesmas gamas de preços e com o mesmo objetivo, rapidamente percebemos que os equipamentos oferecidos e os preços são os mesmos. Os fabricantes de PC baseiam-se em catálogos de componentes idênticos e os resultados reflectem esta geminação técnica. Um laptop Às vezes pode haver uma queda significativa no desempenho devido a uma falha na máquina testada mas sem uma explicação técnica detalhada, a pontuação proposta pelo Benchmark não ilustrará de forma alguma o motivo deste resultado. Um fabricante que faça uma má escolha de ventilação, por exemplo, não será compreensível numa tabela de resultados. O porquê será então destacado no texto que descreve a máquina.

Em essência, pode-se afirmar que o parâmetro de referência compara máquinas com níveis de desempenho altamente comparáveis ​​dentro de uma dotação financeira semelhante, ou exige um exame aprofundado da informação para discernir quaisquer discrepâncias.

Para proporcionar uma avaliação visualmente mais cativante, os testes são normalmente complementados com processos adicionais. Isso ocorre porque comparar produtos semelhantes dentro da mesma categoria não produz resultados significativos. Nesses casos, é necessário exibir uma variedade de dispositivos distintos e únicos para criar um impacto visual impressionante. No entanto, esta abordagem pode resultar numa representação injusta do produto testado, uma vez que pode ser altamente capaz, mas ainda assim ter uma classificação baixa devido à comparação com itens diferentes. Consequentemente, existe a possibilidade de a representação do produto parecer pouco clara ou enganosa ao avaliar produtos idênticos, ou distorcida ao examinar itens de categorias diferentes.

É pouco provável que os indivíduos que alocam um subsídio financeiro de 1000 euros para a compra de um computador portátil se preocupem com as capacidades dos dispositivos com preço de 2500 euros, uma vez que o seu foco principal está dentro da sua própria faixa de preço. Por outro lado, quem procura um computador para edição de vídeo teria como objetivo ideal determinar se um PC pode abordar totalmente todos os aspectos relacionados a esta tarefa específica, em vez de considerar opções mais caras.

/images/53384114386_8d576640a4_o.png

Testes e benchmarks são úteis.

Certamente, os testes são benéficos e indispensáveis. Determinar o desempenho real de um processador ou placa gráfica individual é crucial para compreender suas capacidades. É vital compreender por que algumas fórmulas necessitam de um tipo específico de memória, enquanto outras funcionam adequadamente sem ela. É fundamental determinar se a configuração de rede ou o armazenamento integrado é apropriado e eficiente. A realização de um teste na capacidade de refrigeração fornecida a um processador ainda é relevante hoje. A lógica por trás da realização desses testes reside na avaliação independente das ofertas exclusivas de cada dispositivo, em vez de compará-las com dispositivos não relacionados. É menos significativo comparar a velocidade de armazenamento de uma máquina de 150 euros versus um modelo mais caro apenas para identificar as suas deficiências. No entanto, identificar as razões pelas quais um determinado laptop fornece

/images/53384611245_00e1333845_o.png

Uma mistura de fichas incomparáveis

A prevalência de benchmarks como o teste final na avaliação de produtos de software decorre do compromisso financeiro substancial associado ao desenvolvimento e gestão de tais produtos. A realização de uma série de testes em um sistema de computador pode ser executada remotamente, utilizando uma sequência predeterminada de operações e registrando os resultados correspondentes. Além disso, a delegação de tarefas de teste a entidades externas revela-se financeiramente vantajosa, ao mesmo tempo que proporciona uma fachada de objectividade científica devido aos dados apresentados. No entanto, deve reconhecer-se que a noção de imparcialidade pode nem sempre ser verdadeira em todos os casos.

Em essência, apesar das pontuações serem derivadas de diversas avaliações, elas nem sempre oferecem informações conclusivas sobre a seleção ideal. Por exemplo, um indivíduo preferiria um portátil que obtivesse uma classificação de 1000 através de testes abrangentes e que custasse 1500 euros ou um que obtivesse uma pontuação ligeiramente inferior de 980 mas estivesse disponível por 1200 euros? Além disso, que tal um computador que marcou 950 e custou 1500 euros, mas funcionou sem qualquer ruído? Tais considerações destacam a dificuldade em determinar a opção ideal entre essas alternativas.

Parece-me de pouca importância que as pontuações sejam determinadas exclusivamente através da utilização de software desconhecido, cujas complexidades de metodologia e processos computacionais permanecem enigmáticas. Cada vez mais, parece que as opiniões relativas às máquinas são moldadas por classificações derivadas de sessões de benchmarking. Consequentemente, as narrativas históricas parecem ser elaboradas com base em noções preconcebidas, em vez de num reflexo preciso das experiências encontradas com o dispositivo avaliado. Um problema recorrente surge quando o desempenho de uma determinada máquina se desvia significativamente da norma; tais casos muitas vezes resultam em ser considerado insignificante ou mesmo inepto, sem levar em conta fatores como sua funcionalidade, custo e recursos adicionais.

/images/53384184311_ce79591754_o.png

Qual alternativa aos Benchmarks?

Na minha opinião, os benchmarks diários têm relevância limitada. O conhecimento de que um dispositivo fornece uma pontuação dentro de um intervalo de 50 a 150 pontos num teste Lambda, o que representa apenas 1/20.000 da sua capacidade total, fornece poucos insights ao consumidor. Em vez disso, compreender o desempenho de um conjunto específico de aplicativos para uma finalidade específica forneceria informações mais significativas. Embora possa não ter a precisão associada à análise técnica, fornece detalhes pertinentes que podem auxiliar na tomada de decisões, abordando as principais preocupações do usuário em relação à aplicação prática.

Para contornar as limitações impostas pelos benchmarks tradicionais, desenvolvi uma abordagem alternativa. Em vez de focar nas taxas de quadros e velocidades computacionais em vários jogos ou testes, meu objetivo é estabelecer uma métrica que quantifique a versatilidade de um determinado dispositivo em uma ampla gama de aplicações. Para isso, pretendo empregar um sistema de avaliação abrangente que classifique diferentes cenários de uso de acordo com seu nível de complexidade e demanda. Ao fazê-lo, tornar-se-á evidente que mesmo os mini PCs básicos podem acomodar funcionalidades de nível profissional em software de produtividade comum, evitando assim a necessidade de investir em máquinas proibitivamente dispendiosas apenas para fins contabilísticos.

Compreender as capacidades de desempenho de um computador pessoal específico isoladamente fornece uma visão limitada do seu potencial geral. É muito mais informativo avaliar como ele se compara a uma gama mais ampla de dispositivos com orçamentos e requisitos de energia variados. No entanto, o que realmente importa é se o dispositivo pode lidar com tarefas diárias de maneira eficaz, como executar software de edição de fotos ou controlar jogos 2D e 3D sem problemas. Por exemplo, quem procura um minicomputador acessível para edição básica de fotos pode optar por um minicomputador com preço de algumas centenas de euros, enquanto quem necessita de equipamento especializado pode ter que gastar mais. Em última análise, apresentar informações sobre o desempenho de um PC num formato transparente e de fácil compreensão permite aos utilizadores determinar se o seu sistema atual satisfaz as suas necessidades ou se é necessária uma atualização ou substituição,

O método proposto tem maior significado para mim, pois promove a prudência nas despesas, ao mesmo tempo que se alinha com as necessidades reais, em vez de procurar recompensas arbitrárias que podem perder o propósito pretendido no meio da viagem. A abundância de benchmarks facilmente acessíveis online reforça ainda mais a sua praticidade. Caso um indivíduo deseje consultar tais informações, poderá acessá-las sem esforço por meio de uma breve pesquisa na Internet.

Embora ainda esteja explorando o melhor método para implementar esta estratégia, meu objetivo é descobrir uma representação fácil de entender. Idealmente, haveria uma exibição visual que permitisse compreender rapidamente qual dispositivo atende às demandas mais prevalentes. Embora eu possa ocasionalmente realizar alguns experimentos para confirmar minhas conclusões, meu foco principal será traduzir os resultados em uma descrição gráfica simples e concisa, em vez de compilar numerosas tabelas intrincadas cheias de dados pouco claros e desprovidos de relevância contextual.

/images/10913790116_1b5eb916d2.jpg

Testes em Minimáquinas?

Certamente, reconheço a escassez de avaliações disponíveis em meu blog. Essa deficiência pode ser atribuída a fatores favoráveis ​​e desfavoráveis. No entanto, tenha certeza de que a escassez de depoimentos não persistirá indefinidamente, pois recentemente reacendi meu entusiasmo pela avaliação de produtos. Na verdade, possuo vários dispositivos que aguardam pacientemente sua vez sob as lentes minuciosas da análise crítica, enquanto modelos mais recentes ocupam minha atenção. Meu grande desejo de examinar minuciosamente esses itens e compartilhar minhas descobertas com vocês, meu estimado público, foi revigorado.

Sempre que tenho a tarefa de avaliar produtos que não atendem aos meus interesses pessoais, tendo a ficar um tanto apreensivo. Por outro lado, escrever comentários sobre dispositivos que realmente me interessam é bastante fácil. Fico perplexo porque posso facilmente redigir uma avaliação eloqüente do Transformer Book T100, enquanto me esforço para formular pensamentos sobre gadgets que têm menos apelo. Depois de muita reflexão, percebi que a razão está na abordagem que adoto ao enfrentar tais desafios. Em vez de empregar métodos inovadores para explorar o seu potencial, recorro a técnicas de teste convencionais que produzem resultados insuficientes. Consequentemente, estas ferramentas são incapazes de revelar as nuances e características únicas destes dispositivos. Portanto, torna-se cada vez mais difícil diferenciar entre

Em momentos de necessidade, pode ser benéfico estabelecer um sistema de monitoramento para as capacidades de processamento de dispositivos como o Intel N100 ou o amplamente utilizado Ryzen 7 5700U em minicomputadores. Este sistema deve ser continuamente atualizado e expandido através de novos métodos de teste. Em vez de discutir repetidamente as características individuais de cada dispositivo, é mais prático apresentar orientações gerais para lidar com eles dentro de categorias específicas de bilhetes. Embora o exame minucioso do desempenho da máquina continue a ser essencial, ele não deve ditar apenas o foco dos nossos serviços.

Uma abordagem mais centrada no usuário é necessária para futuros empreendimentos de testes. Isto envolve o desenvolvimento de avaliações mais simples, porém compreensíveis, que atendam às necessidades dos usuários.

*️⃣ Link da fonte:

Trabalho resumido do NotebookCheck , ,