<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Slow Reordering in Pardiso in Intel® oneAPI Math Kernel Library</title>
    <link>https://community.intel.com/t5/Intel-oneAPI-Math-Kernel-Library/Slow-Reordering-in-Pardiso/m-p/979800#M17373</link>
    <description>&lt;P&gt;Hello,&lt;BR /&gt;I am implementing Pardiso(direct and hybrid CGS) in legacy code to speedup. The setup is for 3D FDM with Newton method. The calling sequence is as follows: every first call in time marching with phase=13 and every Newton iterations with phase=23.&lt;/P&gt;
&lt;P&gt;The hybrid CGS with phase=23 runs fast, however, reordering (during the call with phase 13)&amp;nbsp; is very costly, for example,~ 85%(more than expected?) of the solvetime with Pardiso(see below) and thus overall runs slow. Is reordering phase parallelized in pardiso? Could you please share your suggestions for reducing reordering time in pardiso?&lt;BR /&gt;Thank you,&lt;BR /&gt;Sagar&lt;BR /&gt;&lt;BR /&gt;Here are the details:&lt;BR /&gt;Case: Non-symmetric, 118,800 uknowns, sparse ~700,000 nnz,&amp;nbsp; from 9 (2*2) block band matrix.&lt;BR /&gt;Machine: Intel Xeon E5-2687, 3.1 GHz, 32 GB&lt;BR /&gt;&amp;nbsp;&amp;nbsp; &amp;nbsp;: Intel Composer XE(Fortran) 2011 Upgrade 11(Package 344), MKL 10.3 Update 11 and 64bit Windows 7 SP 1&lt;BR /&gt;Compile:&amp;nbsp; /O1 /Qparallel&amp;nbsp; /Qopenmp /Qmkl:parallel &lt;BR /&gt;Link :&amp;nbsp;&amp;nbsp; mkl_blas95_lp64.lib&amp;nbsp; mkl_lapack95_lp64.lib mkl_intel_lp64.lib mkl_intel_thread.lib&amp;nbsp; mkl_core.lib&lt;BR /&gt;&lt;BR /&gt;Pardiso Parameters:&lt;STRONG&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;For First call(Phase=13):&lt;/STRONG&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(1) = 1 ! no solver default&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(2) = 3 ! fill-in reordering from METIS, 0-MIN DEGREE, 2-METIS, 3-OPENMP VERSION&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; !&amp;nbsp; iparm(3) = mkl_get_max_threads() ! numbers of processors, value of MKL_NUM_THREADS&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(4) = 0 ! no iterative-direct algorithm&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(5) = 0 ! no user fill-in reducing permutation, return the array&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(6) = 0 ! =0 solution on the first n components of x&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(7) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(8) = 0 ! numbers of iterative refinement steps&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(9) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(10) = 13 ! perturb the pivot elements with 1E-13&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(11) = 0 ! use nonsymmetric permutation and scaling&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(12) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(13) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(14) = 0 ! Output: number of perturbed pivots&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(15) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(16) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(17) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(18) = -1 ! Output: number of nonzeros in the factor LU&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(19) = 0 ! Output: Mflops for LU factorization&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(20) = 0 ! Output: Numbers of CG Iterations&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(27) = 0&amp;nbsp; ! Check for the matrix, default, &lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; msglvl = 1 ! print statistical information, 0=no 1=yes&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; mtype&amp;nbsp; = 11 ! real unsymmetric&lt;BR /&gt;&lt;STRONG&gt;For seond call(Phase=23):&lt;/STRONG&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(1) = 1 ! no solver default&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(2) = 3 ! fill-in reordering from METIS, 0-MIN DEGREE, 2-METIS, 3-OPENMP VERSION&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; !&amp;nbsp; iparm(3) = mkl_get_max_threads() ! numbers of processors, value of MKL_NUM_THREADS&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(4) = 61 ! no iterative-direct algorithm&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(5) = 0 ! no user fill-in reducing permutation, use from the last one&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(6) = 0 ! =0 solution on the first n components of x&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(7) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(8) = 0 ! numbers of iterative refinement steps&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(9) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(10) = 13 ! perturb the pivot elements with 1E-13&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(11) = 0 ! use nonsymmetric permutation and scaling MPS&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(12) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(13) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(14) = 0 ! Output: number of perturbed pivots&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(15) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(16) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(17) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(18) = -1 ! Output: number of nonzeros in the factor LU&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(19) = 0 ! Output: Mflops for LU factorization&lt;BR /&gt;&amp;nbsp; !&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(20) = 0 ! Output: Numbers of CG Iterations&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(27) = 0&amp;nbsp; ! Check for the matrix, default&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; msglvl = 1 ! print statistical information&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; mtype&amp;nbsp; = 11 ! real unsymmetric&lt;BR /&gt;&lt;BR /&gt;Here are the results:&lt;BR /&gt;&lt;STRONG&gt;*******First call, phase=13********&lt;/STRONG&gt;&lt;BR /&gt;Percentage of computed non-zeros for LL^T factorization&lt;BR /&gt;0%&amp;nbsp;&amp;nbsp; &amp;nbsp;1%&amp;nbsp;&amp;nbsp; &amp;nbsp;2%&amp;nbsp;&amp;nbsp; &amp;nbsp;3%&amp;nbsp;&amp;nbsp; &amp;nbsp;4%&amp;nbsp;&amp;nbsp; &amp;nbsp;5%&amp;nbsp;&amp;nbsp; &amp;nbsp;6%&amp;nbsp;&amp;nbsp; &amp;nbsp;7%&amp;nbsp;&amp;nbsp; &amp;nbsp;8%&amp;nbsp;&amp;nbsp; &amp;nbsp;9%&amp;nbsp;&amp;nbsp; &amp;nbsp;10%&amp;nbsp;&amp;nbsp; &amp;nbsp;11%&amp;nbsp;&amp;nbsp; &amp;nbsp;12%&amp;nbsp;&amp;nbsp; &amp;nbsp;13%&amp;nbsp;&amp;nbsp; &amp;nbsp;14%&amp;nbsp;&amp;nbsp; &amp;nbsp;15%&amp;nbsp;&amp;nbsp; &amp;nbsp;16%&amp;nbsp;&amp;nbsp; &amp;nbsp;17%&amp;nbsp;&amp;nbsp; &amp;nbsp;18%&amp;nbsp;&amp;nbsp; &amp;nbsp;19%&amp;nbsp;&amp;nbsp; &amp;nbsp;20%&amp;nbsp;&amp;nbsp; &amp;nbsp;21%&amp;nbsp;&amp;nbsp; &amp;nbsp;22%&amp;nbsp;&amp;nbsp; &amp;nbsp;23%&amp;nbsp;&amp;nbsp; &amp;nbsp;24%&amp;nbsp;&amp;nbsp; &amp;nbsp;25%&amp;nbsp;&amp;nbsp; &amp;nbsp;26%&amp;nbsp;&amp;nbsp; &amp;nbsp;27%&amp;nbsp;&amp;nbsp; &amp;nbsp;28%&amp;nbsp;&amp;nbsp; &amp;nbsp;29%&amp;nbsp;&amp;nbsp; &amp;nbsp;30%&amp;nbsp;&amp;nbsp; &amp;nbsp;31%&amp;nbsp;&amp;nbsp; &amp;nbsp;32%&amp;nbsp;&amp;nbsp; &amp;nbsp;33%&amp;nbsp;&amp;nbsp; &amp;nbsp;35%&amp;nbsp;&amp;nbsp; &amp;nbsp;37%&amp;nbsp;&amp;nbsp; &amp;nbsp;39%&amp;nbsp;&amp;nbsp; &amp;nbsp;42%&amp;nbsp;&amp;nbsp; &amp;nbsp;43%&amp;nbsp;&amp;nbsp; &amp;nbsp;44%&amp;nbsp;&amp;nbsp; &amp;nbsp;46%&amp;nbsp;&amp;nbsp; &amp;nbsp;48%&amp;nbsp;&amp;nbsp; &amp;nbsp;55%&amp;nbsp;&amp;nbsp; &amp;nbsp;56%&amp;nbsp;&amp;nbsp; &amp;nbsp;62%&amp;nbsp;&amp;nbsp; &amp;nbsp;73%&amp;nbsp;&amp;nbsp; &amp;nbsp;81%&amp;nbsp;&amp;nbsp; &amp;nbsp;88%&amp;nbsp;&amp;nbsp; &amp;nbsp;95%&amp;nbsp;&amp;nbsp; &amp;nbsp;99%&amp;nbsp;&amp;nbsp; &amp;nbsp;100%&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;=== PARDISO: solving a real nonsymmetric system ===&lt;BR /&gt;The local (internal) PARDISO version is&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 103900117&lt;BR /&gt;1-based array indexing is turned ON&lt;BR /&gt;PARDISO double precision computation is turned ON&lt;BR /&gt;Parallel METIS algorithm at reorder step is turned ON&lt;BR /&gt;Single-level factorization algorithm is turned ON&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;Summary: ( starting phase is reordering, ending phase is solution )&lt;BR /&gt;================&lt;BR /&gt;&lt;BR /&gt;Times:&lt;BR /&gt;======&lt;BR /&gt;Time spent in calculations of symmetric matrix portrait (fulladj): 0.006631 s&lt;BR /&gt;Time spent in reordering of the initial matrix (reorder)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 1.326915 s&lt;BR /&gt;Time spent in symbolic factorization (symbfct)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.025506 s&lt;BR /&gt;Time spent in data preparations for factorization (parlist)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.001083 s&lt;BR /&gt;Time spent in copying matrix to internal data structure (A to LU): 0.000000 s&lt;BR /&gt;Time spent in factorization step (numfct)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.063961 s&lt;BR /&gt;Time spent in direct solver at solve step (solve)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.005209 s&lt;BR /&gt;Time spent in allocation of internal data structures (malloc)&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.030586 s&lt;BR /&gt;Time spent in additional calculations&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.029167 s&lt;BR /&gt;Total time spent&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 1.489059 s&lt;BR /&gt;&lt;BR /&gt;Statistics:&lt;BR /&gt;===========&lt;BR /&gt;&amp;lt; Parallel Direct Factorization with number of processors: &amp;gt; 8&lt;BR /&gt;&amp;lt; Numerical Factorization with BLAS3 and O(n) synchronization &amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Linear system Ax = b &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of equations:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 118800&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 634440&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A (): 0.004495&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of right-hand sides:&amp;nbsp;&amp;nbsp;&amp;nbsp; 1&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Factors L and U &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of columns for each panel: 72&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of independent subgraphs:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of supernodes:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 55108&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; size of largest supernode:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 646&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3906892&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3322300&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L+U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 7229192&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop&amp;nbsp;&amp;nbsp; for the numerical factorization: 2.709704&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop/s for the numerical factorization: 42.364605&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;*******Second call, phase=23********&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;Percentage of computed non-zeros for LL^T factorization&lt;BR /&gt;0%&amp;nbsp;&amp;nbsp; &amp;nbsp;1%&amp;nbsp;&amp;nbsp; &amp;nbsp;2%&amp;nbsp;&amp;nbsp; &amp;nbsp;3%&amp;nbsp;&amp;nbsp; &amp;nbsp;4%&amp;nbsp;&amp;nbsp; &amp;nbsp;5%&amp;nbsp;&amp;nbsp; &amp;nbsp;6%&amp;nbsp;&amp;nbsp; &amp;nbsp;7%&amp;nbsp;&amp;nbsp; &amp;nbsp;8%&amp;nbsp;&amp;nbsp; &amp;nbsp;9%&amp;nbsp;&amp;nbsp; &amp;nbsp;10%&amp;nbsp;&amp;nbsp; &amp;nbsp;11%&amp;nbsp;&amp;nbsp; &amp;nbsp;12%&amp;nbsp;&amp;nbsp; &amp;nbsp;13%&amp;nbsp;&amp;nbsp; &amp;nbsp;14%&amp;nbsp;&amp;nbsp; &amp;nbsp;15%&amp;nbsp;&amp;nbsp; &amp;nbsp;16%&amp;nbsp;&amp;nbsp; &amp;nbsp;17%&amp;nbsp;&amp;nbsp; &amp;nbsp;18%&amp;nbsp;&amp;nbsp; &amp;nbsp;19%&amp;nbsp;&amp;nbsp; &amp;nbsp;20%&amp;nbsp;&amp;nbsp; &amp;nbsp;21%&amp;nbsp;&amp;nbsp; &amp;nbsp;22%&amp;nbsp;&amp;nbsp; &amp;nbsp;23%&amp;nbsp;&amp;nbsp; &amp;nbsp;24%&amp;nbsp;&amp;nbsp; &amp;nbsp;25%&amp;nbsp;&amp;nbsp; &amp;nbsp;26%&amp;nbsp;&amp;nbsp; &amp;nbsp;27%&amp;nbsp;&amp;nbsp; &amp;nbsp;28%&amp;nbsp;&amp;nbsp; &amp;nbsp;29%&amp;nbsp;&amp;nbsp; &amp;nbsp;30%&amp;nbsp;&amp;nbsp; &amp;nbsp;31%&amp;nbsp;&amp;nbsp; &amp;nbsp;33%&amp;nbsp;&amp;nbsp; &amp;nbsp;34%&amp;nbsp;&amp;nbsp; &amp;nbsp;35%&amp;nbsp;&amp;nbsp; &amp;nbsp;39%&amp;nbsp;&amp;nbsp; &amp;nbsp;42%&amp;nbsp;&amp;nbsp; &amp;nbsp;43%&amp;nbsp;&amp;nbsp; &amp;nbsp;44%&amp;nbsp;&amp;nbsp; &amp;nbsp;48%&amp;nbsp;&amp;nbsp; &amp;nbsp;51%&amp;nbsp;&amp;nbsp; &amp;nbsp;53%&amp;nbsp;&amp;nbsp; &amp;nbsp;59%&amp;nbsp;&amp;nbsp; &amp;nbsp;68%&amp;nbsp;&amp;nbsp; &amp;nbsp;70%&amp;nbsp;&amp;nbsp; &amp;nbsp;77%&amp;nbsp;&amp;nbsp; &amp;nbsp;84%&amp;nbsp;&amp;nbsp; &amp;nbsp;93%&amp;nbsp;&amp;nbsp; &amp;nbsp;99%&amp;nbsp;&amp;nbsp; &amp;nbsp;100%&lt;BR /&gt;&lt;BR /&gt;=== PARDISO: solving a real nonsymmetric system ===&lt;BR /&gt;Single-level factorization algorithm is turned ON&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;Summary: ( starting phase is factorization, ending phase is solution )&lt;BR /&gt;================&lt;BR /&gt;&lt;BR /&gt;Times:&lt;BR /&gt;======&lt;BR /&gt;Time spent in copying matrix to internal data structure (A to LU): 0.000000 s&lt;BR /&gt;Time spent in factorization step (numfct)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.070308 s&lt;BR /&gt;Time spent in iterative solver at solve step (cgs)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.013775 s cg&lt;BR /&gt;x iterations 1&lt;BR /&gt;&lt;BR /&gt;Time spent in allocation of internal data structures (malloc)&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.001296 s&lt;BR /&gt;Time spent in additional calculations&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.000001 s&lt;BR /&gt;Total time spent&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.085381 s&lt;BR /&gt;&lt;BR /&gt;Statistics:&lt;BR /&gt;===========&lt;BR /&gt;&amp;lt; Parallel Direct Factorization with number of processors: &amp;gt; 8&lt;BR /&gt;&amp;lt; Hybrid Solver PARDISO with CGS/CG Iteration &amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Linear system Ax = b &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of equations:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 118800&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 634440&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A (): 0.004495&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of right-hand sides:&amp;nbsp;&amp;nbsp;&amp;nbsp; 1&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Factors L and U &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of columns for each panel: 72&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of independent subgraphs:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of supernodes:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 55108&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; size of largest supernode:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 646&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3906892&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3322300&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L+U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 7229192&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop&amp;nbsp;&amp;nbsp; for the numerical factorization: 2.709704&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop/s for the numerical factorization: 38.540249&lt;BR /&gt;iparm(20) :&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 1&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;/P&gt;</description>
    <pubDate>Thu, 27 Dec 2012 21:40:35 GMT</pubDate>
    <dc:creator>sagarmatha</dc:creator>
    <dc:date>2012-12-27T21:40:35Z</dc:date>
    <item>
      <title>Slow Reordering in Pardiso</title>
      <link>https://community.intel.com/t5/Intel-oneAPI-Math-Kernel-Library/Slow-Reordering-in-Pardiso/m-p/979800#M17373</link>
      <description>&lt;P&gt;Hello,&lt;BR /&gt;I am implementing Pardiso(direct and hybrid CGS) in legacy code to speedup. The setup is for 3D FDM with Newton method. The calling sequence is as follows: every first call in time marching with phase=13 and every Newton iterations with phase=23.&lt;/P&gt;
&lt;P&gt;The hybrid CGS with phase=23 runs fast, however, reordering (during the call with phase 13)&amp;nbsp; is very costly, for example,~ 85%(more than expected?) of the solvetime with Pardiso(see below) and thus overall runs slow. Is reordering phase parallelized in pardiso? Could you please share your suggestions for reducing reordering time in pardiso?&lt;BR /&gt;Thank you,&lt;BR /&gt;Sagar&lt;BR /&gt;&lt;BR /&gt;Here are the details:&lt;BR /&gt;Case: Non-symmetric, 118,800 uknowns, sparse ~700,000 nnz,&amp;nbsp; from 9 (2*2) block band matrix.&lt;BR /&gt;Machine: Intel Xeon E5-2687, 3.1 GHz, 32 GB&lt;BR /&gt;&amp;nbsp;&amp;nbsp; &amp;nbsp;: Intel Composer XE(Fortran) 2011 Upgrade 11(Package 344), MKL 10.3 Update 11 and 64bit Windows 7 SP 1&lt;BR /&gt;Compile:&amp;nbsp; /O1 /Qparallel&amp;nbsp; /Qopenmp /Qmkl:parallel &lt;BR /&gt;Link :&amp;nbsp;&amp;nbsp; mkl_blas95_lp64.lib&amp;nbsp; mkl_lapack95_lp64.lib mkl_intel_lp64.lib mkl_intel_thread.lib&amp;nbsp; mkl_core.lib&lt;BR /&gt;&lt;BR /&gt;Pardiso Parameters:&lt;STRONG&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;For First call(Phase=13):&lt;/STRONG&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(1) = 1 ! no solver default&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(2) = 3 ! fill-in reordering from METIS, 0-MIN DEGREE, 2-METIS, 3-OPENMP VERSION&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; !&amp;nbsp; iparm(3) = mkl_get_max_threads() ! numbers of processors, value of MKL_NUM_THREADS&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(4) = 0 ! no iterative-direct algorithm&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(5) = 0 ! no user fill-in reducing permutation, return the array&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(6) = 0 ! =0 solution on the first n components of x&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(7) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(8) = 0 ! numbers of iterative refinement steps&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(9) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(10) = 13 ! perturb the pivot elements with 1E-13&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(11) = 0 ! use nonsymmetric permutation and scaling&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(12) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(13) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(14) = 0 ! Output: number of perturbed pivots&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(15) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(16) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(17) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(18) = -1 ! Output: number of nonzeros in the factor LU&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(19) = 0 ! Output: Mflops for LU factorization&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(20) = 0 ! Output: Numbers of CG Iterations&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(27) = 0&amp;nbsp; ! Check for the matrix, default, &lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; msglvl = 1 ! print statistical information, 0=no 1=yes&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; mtype&amp;nbsp; = 11 ! real unsymmetric&lt;BR /&gt;&lt;STRONG&gt;For seond call(Phase=23):&lt;/STRONG&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(1) = 1 ! no solver default&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(2) = 3 ! fill-in reordering from METIS, 0-MIN DEGREE, 2-METIS, 3-OPENMP VERSION&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; !&amp;nbsp; iparm(3) = mkl_get_max_threads() ! numbers of processors, value of MKL_NUM_THREADS&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(4) = 61 ! no iterative-direct algorithm&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(5) = 0 ! no user fill-in reducing permutation, use from the last one&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(6) = 0 ! =0 solution on the first n components of x&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(7) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(8) = 0 ! numbers of iterative refinement steps&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(9) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(10) = 13 ! perturb the pivot elements with 1E-13&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(11) = 0 ! use nonsymmetric permutation and scaling MPS&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(12) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(13) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(14) = 0 ! Output: number of perturbed pivots&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(15) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(16) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(17) = 0 ! not in use&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(18) = -1 ! Output: number of nonzeros in the factor LU&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(19) = 0 ! Output: Mflops for LU factorization&lt;BR /&gt;&amp;nbsp; !&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(20) = 0 ! Output: Numbers of CG Iterations&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; iparm(27) = 0&amp;nbsp; ! Check for the matrix, default&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; msglvl = 1 ! print statistical information&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; mtype&amp;nbsp; = 11 ! real unsymmetric&lt;BR /&gt;&lt;BR /&gt;Here are the results:&lt;BR /&gt;&lt;STRONG&gt;*******First call, phase=13********&lt;/STRONG&gt;&lt;BR /&gt;Percentage of computed non-zeros for LL^T factorization&lt;BR /&gt;0%&amp;nbsp;&amp;nbsp; &amp;nbsp;1%&amp;nbsp;&amp;nbsp; &amp;nbsp;2%&amp;nbsp;&amp;nbsp; &amp;nbsp;3%&amp;nbsp;&amp;nbsp; &amp;nbsp;4%&amp;nbsp;&amp;nbsp; &amp;nbsp;5%&amp;nbsp;&amp;nbsp; &amp;nbsp;6%&amp;nbsp;&amp;nbsp; &amp;nbsp;7%&amp;nbsp;&amp;nbsp; &amp;nbsp;8%&amp;nbsp;&amp;nbsp; &amp;nbsp;9%&amp;nbsp;&amp;nbsp; &amp;nbsp;10%&amp;nbsp;&amp;nbsp; &amp;nbsp;11%&amp;nbsp;&amp;nbsp; &amp;nbsp;12%&amp;nbsp;&amp;nbsp; &amp;nbsp;13%&amp;nbsp;&amp;nbsp; &amp;nbsp;14%&amp;nbsp;&amp;nbsp; &amp;nbsp;15%&amp;nbsp;&amp;nbsp; &amp;nbsp;16%&amp;nbsp;&amp;nbsp; &amp;nbsp;17%&amp;nbsp;&amp;nbsp; &amp;nbsp;18%&amp;nbsp;&amp;nbsp; &amp;nbsp;19%&amp;nbsp;&amp;nbsp; &amp;nbsp;20%&amp;nbsp;&amp;nbsp; &amp;nbsp;21%&amp;nbsp;&amp;nbsp; &amp;nbsp;22%&amp;nbsp;&amp;nbsp; &amp;nbsp;23%&amp;nbsp;&amp;nbsp; &amp;nbsp;24%&amp;nbsp;&amp;nbsp; &amp;nbsp;25%&amp;nbsp;&amp;nbsp; &amp;nbsp;26%&amp;nbsp;&amp;nbsp; &amp;nbsp;27%&amp;nbsp;&amp;nbsp; &amp;nbsp;28%&amp;nbsp;&amp;nbsp; &amp;nbsp;29%&amp;nbsp;&amp;nbsp; &amp;nbsp;30%&amp;nbsp;&amp;nbsp; &amp;nbsp;31%&amp;nbsp;&amp;nbsp; &amp;nbsp;32%&amp;nbsp;&amp;nbsp; &amp;nbsp;33%&amp;nbsp;&amp;nbsp; &amp;nbsp;35%&amp;nbsp;&amp;nbsp; &amp;nbsp;37%&amp;nbsp;&amp;nbsp; &amp;nbsp;39%&amp;nbsp;&amp;nbsp; &amp;nbsp;42%&amp;nbsp;&amp;nbsp; &amp;nbsp;43%&amp;nbsp;&amp;nbsp; &amp;nbsp;44%&amp;nbsp;&amp;nbsp; &amp;nbsp;46%&amp;nbsp;&amp;nbsp; &amp;nbsp;48%&amp;nbsp;&amp;nbsp; &amp;nbsp;55%&amp;nbsp;&amp;nbsp; &amp;nbsp;56%&amp;nbsp;&amp;nbsp; &amp;nbsp;62%&amp;nbsp;&amp;nbsp; &amp;nbsp;73%&amp;nbsp;&amp;nbsp; &amp;nbsp;81%&amp;nbsp;&amp;nbsp; &amp;nbsp;88%&amp;nbsp;&amp;nbsp; &amp;nbsp;95%&amp;nbsp;&amp;nbsp; &amp;nbsp;99%&amp;nbsp;&amp;nbsp; &amp;nbsp;100%&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;=== PARDISO: solving a real nonsymmetric system ===&lt;BR /&gt;The local (internal) PARDISO version is&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 103900117&lt;BR /&gt;1-based array indexing is turned ON&lt;BR /&gt;PARDISO double precision computation is turned ON&lt;BR /&gt;Parallel METIS algorithm at reorder step is turned ON&lt;BR /&gt;Single-level factorization algorithm is turned ON&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;Summary: ( starting phase is reordering, ending phase is solution )&lt;BR /&gt;================&lt;BR /&gt;&lt;BR /&gt;Times:&lt;BR /&gt;======&lt;BR /&gt;Time spent in calculations of symmetric matrix portrait (fulladj): 0.006631 s&lt;BR /&gt;Time spent in reordering of the initial matrix (reorder)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 1.326915 s&lt;BR /&gt;Time spent in symbolic factorization (symbfct)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.025506 s&lt;BR /&gt;Time spent in data preparations for factorization (parlist)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.001083 s&lt;BR /&gt;Time spent in copying matrix to internal data structure (A to LU): 0.000000 s&lt;BR /&gt;Time spent in factorization step (numfct)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.063961 s&lt;BR /&gt;Time spent in direct solver at solve step (solve)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.005209 s&lt;BR /&gt;Time spent in allocation of internal data structures (malloc)&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.030586 s&lt;BR /&gt;Time spent in additional calculations&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.029167 s&lt;BR /&gt;Total time spent&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 1.489059 s&lt;BR /&gt;&lt;BR /&gt;Statistics:&lt;BR /&gt;===========&lt;BR /&gt;&amp;lt; Parallel Direct Factorization with number of processors: &amp;gt; 8&lt;BR /&gt;&amp;lt; Numerical Factorization with BLAS3 and O(n) synchronization &amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Linear system Ax = b &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of equations:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 118800&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 634440&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A (): 0.004495&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of right-hand sides:&amp;nbsp;&amp;nbsp;&amp;nbsp; 1&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Factors L and U &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of columns for each panel: 72&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of independent subgraphs:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of supernodes:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 55108&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; size of largest supernode:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 646&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3906892&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3322300&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L+U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 7229192&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop&amp;nbsp;&amp;nbsp; for the numerical factorization: 2.709704&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop/s for the numerical factorization: 42.364605&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;*******Second call, phase=23********&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;Percentage of computed non-zeros for LL^T factorization&lt;BR /&gt;0%&amp;nbsp;&amp;nbsp; &amp;nbsp;1%&amp;nbsp;&amp;nbsp; &amp;nbsp;2%&amp;nbsp;&amp;nbsp; &amp;nbsp;3%&amp;nbsp;&amp;nbsp; &amp;nbsp;4%&amp;nbsp;&amp;nbsp; &amp;nbsp;5%&amp;nbsp;&amp;nbsp; &amp;nbsp;6%&amp;nbsp;&amp;nbsp; &amp;nbsp;7%&amp;nbsp;&amp;nbsp; &amp;nbsp;8%&amp;nbsp;&amp;nbsp; &amp;nbsp;9%&amp;nbsp;&amp;nbsp; &amp;nbsp;10%&amp;nbsp;&amp;nbsp; &amp;nbsp;11%&amp;nbsp;&amp;nbsp; &amp;nbsp;12%&amp;nbsp;&amp;nbsp; &amp;nbsp;13%&amp;nbsp;&amp;nbsp; &amp;nbsp;14%&amp;nbsp;&amp;nbsp; &amp;nbsp;15%&amp;nbsp;&amp;nbsp; &amp;nbsp;16%&amp;nbsp;&amp;nbsp; &amp;nbsp;17%&amp;nbsp;&amp;nbsp; &amp;nbsp;18%&amp;nbsp;&amp;nbsp; &amp;nbsp;19%&amp;nbsp;&amp;nbsp; &amp;nbsp;20%&amp;nbsp;&amp;nbsp; &amp;nbsp;21%&amp;nbsp;&amp;nbsp; &amp;nbsp;22%&amp;nbsp;&amp;nbsp; &amp;nbsp;23%&amp;nbsp;&amp;nbsp; &amp;nbsp;24%&amp;nbsp;&amp;nbsp; &amp;nbsp;25%&amp;nbsp;&amp;nbsp; &amp;nbsp;26%&amp;nbsp;&amp;nbsp; &amp;nbsp;27%&amp;nbsp;&amp;nbsp; &amp;nbsp;28%&amp;nbsp;&amp;nbsp; &amp;nbsp;29%&amp;nbsp;&amp;nbsp; &amp;nbsp;30%&amp;nbsp;&amp;nbsp; &amp;nbsp;31%&amp;nbsp;&amp;nbsp; &amp;nbsp;33%&amp;nbsp;&amp;nbsp; &amp;nbsp;34%&amp;nbsp;&amp;nbsp; &amp;nbsp;35%&amp;nbsp;&amp;nbsp; &amp;nbsp;39%&amp;nbsp;&amp;nbsp; &amp;nbsp;42%&amp;nbsp;&amp;nbsp; &amp;nbsp;43%&amp;nbsp;&amp;nbsp; &amp;nbsp;44%&amp;nbsp;&amp;nbsp; &amp;nbsp;48%&amp;nbsp;&amp;nbsp; &amp;nbsp;51%&amp;nbsp;&amp;nbsp; &amp;nbsp;53%&amp;nbsp;&amp;nbsp; &amp;nbsp;59%&amp;nbsp;&amp;nbsp; &amp;nbsp;68%&amp;nbsp;&amp;nbsp; &amp;nbsp;70%&amp;nbsp;&amp;nbsp; &amp;nbsp;77%&amp;nbsp;&amp;nbsp; &amp;nbsp;84%&amp;nbsp;&amp;nbsp; &amp;nbsp;93%&amp;nbsp;&amp;nbsp; &amp;nbsp;99%&amp;nbsp;&amp;nbsp; &amp;nbsp;100%&lt;BR /&gt;&lt;BR /&gt;=== PARDISO: solving a real nonsymmetric system ===&lt;BR /&gt;Single-level factorization algorithm is turned ON&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;Summary: ( starting phase is factorization, ending phase is solution )&lt;BR /&gt;================&lt;BR /&gt;&lt;BR /&gt;Times:&lt;BR /&gt;======&lt;BR /&gt;Time spent in copying matrix to internal data structure (A to LU): 0.000000 s&lt;BR /&gt;Time spent in factorization step (numfct)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.070308 s&lt;BR /&gt;Time spent in iterative solver at solve step (cgs)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.013775 s cg&lt;BR /&gt;x iterations 1&lt;BR /&gt;&lt;BR /&gt;Time spent in allocation of internal data structures (malloc)&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.001296 s&lt;BR /&gt;Time spent in additional calculations&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.000001 s&lt;BR /&gt;Total time spent&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; : 0.085381 s&lt;BR /&gt;&lt;BR /&gt;Statistics:&lt;BR /&gt;===========&lt;BR /&gt;&amp;lt; Parallel Direct Factorization with number of processors: &amp;gt; 8&lt;BR /&gt;&amp;lt; Hybrid Solver PARDISO with CGS/CG Iteration &amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Linear system Ax = b &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of equations:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 118800&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 634440&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in A (): 0.004495&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of right-hand sides:&amp;nbsp;&amp;nbsp;&amp;nbsp; 1&lt;BR /&gt;&lt;BR /&gt;&amp;lt; Factors L and U &amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of columns for each panel: 72&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of independent subgraphs:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of supernodes:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 55108&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; size of largest supernode:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 646&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3906892&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 3322300&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; number of non-zeros in L+U:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 7229192&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop&amp;nbsp;&amp;nbsp; for the numerical factorization: 2.709704&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; gflop/s for the numerical factorization: 38.540249&lt;BR /&gt;iparm(20) :&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 1&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;/P&gt;</description>
      <pubDate>Thu, 27 Dec 2012 21:40:35 GMT</pubDate>
      <guid>https://community.intel.com/t5/Intel-oneAPI-Math-Kernel-Library/Slow-Reordering-in-Pardiso/m-p/979800#M17373</guid>
      <dc:creator>sagarmatha</dc:creator>
      <dc:date>2012-12-27T21:40:35Z</dc:date>
    </item>
  </channel>
</rss>

